Prashanth Chandrasekar ซีอีโอ Stack Overflow กล่าวว่าบริษัทเตรียมคิดเงินบริษัทผู้พัฒนา AI ขนาดใหญ่ ภายในช่วงกลางปีนี้ หากต้องการเข้าถึงข้อมูลคำถาม-คำตอบในแพลตฟอร์ม ที่มีมากกว่า 50 ล้านคำถาม
ทั้งนี้ Stack Overflow มีผู้ใช้งานลงทะเบียนปัจจุบันมากกว่า 20 ล้านบัญชี
แนวทางของ Stack Overflow นี้ ออกมาเหมือนกับ Reddit ที่ประกาศก่อนหน้านี้ ว่าหากผู้พัฒนา AI ต้องการข้อมูลจำนวนมากไปเทรนโมเดล จะต้องจ่ายเงินให้แพลตฟอร์มด้วย ซึ่ง Chandrasekar ก็บอกเพิ่มเติมว่าเนื้อหาในชุมชนออนไลน์ สามารถสร้างคุณค่าให้กับ AI แบบ LLM บริษัทก็ควรได้ผลตอบแทนเพื่อมาลงทุนเพิ่มเติมเช่นกัน
ที่มา: Wired
Comments
เร่ิมมีการเก็บเงิน และ ห้ามเอาข้อมูลไปใช้ฟรีๆแล้ว
เทรนก่อนได้เปรียบ
คิดว่าเดี๋ยวบริษัท AI จะตามไปด้วย Lawsuit มากมาย (ซึ่งมีแนวโน้มว่า Judge/Jury จะมองไปในทางที่ผิดกฎหมายและต้องจ่ายด้วยแน่ๆ)
เพราะทันทีที่เก็บเงินและเป็นเชิงธุรกิจ (คิดเงิน) ข้อมูล Public/Open ที่ไม่คงความ Open แล้วก็ตกไป
ข้อมูลที่ถูกเอาไปเทรนก่อนหน้านั้นมีเยอะแยะที่ติด License, Term of usage, ไหนจะพวก GPL / Open Data / Policy / Agreement ในการนำไปใช้ทำ "เงิน"
AI ที่ถูกเทรนไปแล้ว มันตอบคำถามเองว่า ไม่สามารถ "Selective Unlearn" ข้อมูลบางอย่างได้ แล้วการพิสูจน์ว่า "ไม่ได้เอาข้อมูลที่ติดพวกนี้ไปใช้" มันยากเกินไป
ถึงจะไม่เห็นด้วยกับอีลอน แต่เริ่มแรกของโครงการนั้น มันคือ Open และใช้ Data ของมนุษย์ เพื่อมนุษยชาติ ดังนั้นหลายเจ้ายอมหลับหูหลับตาให้ Scrape ข้อมูลไปใช้ได้ แต่พอการเทรนการทำอะไรสักอย่างมันเริ่มถูกเอามาใช้เป็นพานิชย์ เจ้าที่อยู่รอดจะต้องเป็นเจ้าที่เทรนมาอย่างถูกต้องมากๆ อาจจะเหลือแค่แนวแบบ Adobe เอย หรืออะไรเอย ที่มี่ส่วนแบ่งในข้อมูลที่รอดได้
แต่ก่อนจะไปถึงจุดนั้นคงต้องใช้เวลา
+1 ยิ่งความกลัวของคนที่ตามมาด้วยแล้ว กฎหมายในบางรัฐก็เอื้ออำนวยอยู่แล้วด้วย