Bluesky เสนอแนวทางให้ผู้ใช้งานเลือกได้ ว่าข้อมูลใดถูกนำไปเทรน AI ได้บ้าง

By: arjin

on 16 March 2025 - 12:30 Tags:

Topics:

Bluesky

Social Network

Artificial Intelligence

Bluesky เผยแพร่ร่างข้อเสนอบน Github เกี่ยวกับการเพิ่มตัวเลือก ให้ผู้ใช้งานกำหนดได้ว่าจะอนุญาตให้โพสต์หรือข้อมูลสามารถถูกนำไปใช้ฝึกฝนด้าน AI อย่างไรได้บ้าง

ที่ผ่านมาการเติบโตของผู้ใช้งาน Bluesky ส่วนหนึ่ง เป็นผลจากการปรับนโยบายของ X ที่เปิดให้บริการภายนอกสามารถดึงข้อมูลไปฝึกฝน AI ได้ ถึงแม้จะสามารถ Opt-Out ได้ แต่ทำให้หลายคนเลือกย้ายบ้านไปเลย และ Bluesky ก็ย้ำแนวทางว่าจะไม่นำข้อมูลผู้ใช้งานไปฝึกฝน AI อย่างไรก็ตามเนื่องจากแพลตฟอร์มเป็นแบบเปิดเข้าถึงได้สาธารณะ ทำให้มีรายงานเรื่องการถูกดูดข้อมูลไปฝึกฝน AI อยู่ดี ซึ่ง Bluesky รับปากว่าจะหาแนวทางแก้ไขปัญหานี้

Jay Graber ซีอีโอ Bluesky พูดถึงแนวคิดการกำหนดตัวเลือกนี้ในงานสัมมนา SXSW เมื่อสัปดาห์ที่ผ่านมา ซึ่งกระแสตอบรับก็เป็นไปในทางต่อต้าน Graber จึงชี้แจงต่อมาว่า บริษัทที่พัฒนา Generative AI ต่างดูดข้อมูลสาธารณะตามเว็บต่าง ๆ ไปฝึกฝน AI อยู่แล้ว รวมทั้ง Bluesky ด้วย สิ่งที่เป็นข้อเสนอของ Bluesky คือการกำหนดมาตรฐานคล้าย robots.txt ว่าผู้พัฒนาสามารถดูดข้อมูลใดได้บ้าง

รูปแบบที่ Bluesky เสนอ ให้การกำหนดการเข้าถึงทำงานบน ATProtocol ผู้ใช้งานกำหนดได้ว่าการดึงข้อมูลแบบใดบ้างที่จะอนุญาต เช่น เพื่อฝึกฝน Generative AI, การดึงข้อมูลข้ามโปรโตคอล, การดึงข้อมูลชุดใหญ่, การทำ Archive เป็นต้น

Graber ยอมรับว่าแนวทางนี้เป็นเหมือนการใส่ป้ายกำกับเท่านั้น แต่หากผู้พัฒนาตั้งใจละเมิดก็สามารถทำได้อยู่ดี

ที่มา: TechCrunch