หนังสือพิมพ์ The New York Times (NYT) ยื่นฟ้องไมโครซอฟท์และ OpenAI ฐานใช้งานบทความของหนังสือพิมพ์โดยไม่ได้รับอนุญาต ทั้งการใช้งานไปในชุดข้อมูลสำหรับฝึก LLM และตัว ChatGPT/Copilot เองก็ตอบบทความแทบทั้งบทความของ NYT ออกมาให้ผู้ใช้ได้
OpenAI ไม่ได้เปิดเผยชุดข้อมูลที่ใช้ฝึก GPT-4 แต่ใน GPT-2 และ GPT-3 นั้นเคยเปิดเผยว่าใช้ชุดข้อมูล WebText/WebText2 ที่ดาวน์โหลดข้อมูลจำนวนมากจากเว็บคุณภาพสูง เช่น ลิงก์ได้รับความนิยมบน Reddit และ Common Crawl ข้อมูลที่ได้จากการดูดเว็บปริมาณมหาศาล 410,000 ล้านโทเค็น เฉพาะชุดข้อมูล Common Crawl นี้ก็มีข้อมูลของ NYT มากเป็นอันดับสาม เป็นรองเพียง Google Patents และ Wikipedia เท่านั้น
คำฟ้องระบุว่า NYT พยายามตกลงกับทั้งไมโครซอฟท์และ OpenAI ก่อนหน้านี้แล้ว แต่ไม่สามารถตกลงกันได้
คดีนี้คล้ายกับคดีของ Getty Images ยื่นฟ้อง Stability AI ที่นำภาพไปฝึกปัญญาประดิษฐ์สร้างภาพแบบเดียวกัน
ที่มา - The Verge
Comments
ความนิยมบน
เหมือนคดีที่ฟ้องเรื่องเอานิยายไปเทรน chatgpt แต่ชม bing อยากรู้ว่าบทความที่โดนคัดลอกมีบทความไหนอย่างไรบ้าง บทความนึงๆออกออนไลน์มาคิดว่ามีกี่คนที่เอาข้อความมันเข้า AI กันเพื่อแปลงภาษาไปอ่านหรือทำคอนเทนต์ลงตัวป้องกันเวบไว้บ้างดิ java chatGPT ก็เข้าไม่ได้แล้ว โคตรตลก เหมือนคนเปืดประตูบ้านล่อให้คนอื่นเข้ามาแล้วไปว่าเขาบุกรุก
ต่อให้ไม่มีประตู หรือกำแพงบ้าน แต่เข้าไปในพื้นที่ส่วนบุคคล ก็ถือว่าบุกรุกแล้วครับ
ประเด็นไม่ได้อยู่ที่บทความถูกนำไปเทรน แต่อยู่ที่ Microsoft/OpenAI เป็นคนนำบทความไปเทรน จึงเป็นเหตุให้ฟ้องร้องได้ครับ
แล้วก็... การไม่ป้องกันไม่ใช้ข้ออ้างให้ทำอะไรก็ได้ครับ และผมมองว่าการ victim blaming ก็ไม่ใช่เรื่องตลกด้วย
เหมือนคดีที่ฟ้องเรื่องเอานิยายไปเทรน chatgpt แต่ชม bing อยากรู้ว่าบทความที่โดนคัดลอกมีบทความไหนอย่างไรบ้าง บทความนึงๆออกออนไลน์มาคิดว่ามีกี่คนที่เอาข้อความมันเข้า AI กันเพื่อแปลงภาษาไปอ่านหรือทำคอนเทนต์ลงตัวป้องกันเวบไว้บ้างดิ java chatGPT ก็เข้าไม่ได้แล้ว โคตรตลก เหมือนคนเปืดประตูบ้านล่อให้คนอื่นเข้ามาแล้วไปว่าเขาบุกรุก
แนวคิดผิดไปเยอะครับ เขาฟ้องเขาย่อมสามารถบอกได้ว่าเอาไปเทรน ถ้าพิสูจน์ให้ศาลเชื่อได้ว่าจริงเขาก็ชนะ การพิมพ์หนังสือขายหรือเผยแพร่บทความออนไลน์ไม่ได้หมายความว่าเชิญก็อปเอาไปได้เลย การเปิดประตูบ้านไม่ได้เป็นการเชื้อเชิญให้เข้าไปได้นะครับ เขาอาจจะเปิดเพื่อเข้าออกเอง เปิดเพื่อรับลม การเข้าไปโดยไม่ได้รับเชิญก็เป็นการบุกรุกแล้ว
ถ้ามีใครเห็นคนเปิดประตูบ้านก็รีบเดินเข้าไปในบ้านคนอื่นทันที อ้างว่าเปิดประตูล่อ นี่ต่างหากที่ตลก
สงสัยนิดนึง ทำไม Microsoft ถึงโดนไปด้วยนะ
น่าจะโดนเพราะเป็นผู้ลงทุนกับให้ทรัพยากร train โมเดลครับ
บล็อก: wannaphong.com และ Python 3