New York Times ระบุ OpenAI ดูดวิดีโอ YouTube กว่าล้านชั่วโมงไปแปลงเป็นข้อความฝึก AI

By: lew

on 8 April 2024 - 09:57 Tags:

Topics:

OpenAI

New York Times อ้างแหล่งข่าวไม่เปิดเผยตัว 3 คน ระบุว่า OpenAI ดูดวิดีโอ YouTube มากกว่าล้านชั่วโมงเพื่อไปฝึก GPT-4 แม้ว่าทีมงานภายในจะมีความกังวลว่าการทำเช่นนี้จะเป็นการละเมิดข้อตกลงการใช้งานของ YouTube

ที่ผ่านมาผู้พัฒนาปัญญาประดิษฐ์ในกลุ่ม LLM ต้องการข้อความจำนวนมากเพื่อมาฝึกปัญญาประดิษฐ์ และที่สำคัญข้อความเหล่านั้นต้องเป็นคอนเทนต์คุณภาพสูงเชื่อถือได้ เพื่อฝึกปัญญาประดิษฐ์ให้ตอบเฉพาะข้อมูลที่ถูกต้อง ทาง OpenAI เองก็มีโครงการซื้อคอนเทนต์เหล่านี้อยู่ โดยมีข่าวหลุดออกมาว่าราคาประมาณ 1-5 ล้านดอลลาร์ต่อปี

ข้อมูลที่ใช้ฝึกปัญญาประดิษฐ์ที่ผ่านมามักใช้ชุดข้อมูลไม่ต่างกันมากนัก โดยอาศัยชุดข้อมูลที่ดูดมาจากเว็บจำนวนมาก บางกลุ่มวิจัยเน้นข้อมูลจาก Wikipedia ที่มีการแก้ไขมาแล้ว แต่การขยายข้อมูลที่มากขึ้นหลังจากนี้เริ่มทำได้ยาก การดูดจากเว็บมาเรื่อยๆ ก็อาจจะได้ข้อมูลคุณภาพต่ำ

บริษัทอื่นๆ นอกจาก OpenAI นั้นมีความได้เปรียบเพราะมีแพลตฟอร์มของตัวเอง กูเกิลเคยระบุว่าใช้คอนเทนต์จาก YouTube มาฝึกปัญญาประดิษฐ์หากได้รับคำยินยอมจากเจ้าของคอนเทนต์ ส่วน Meta ก็มีแพลตฟอร์มอย่าง Instagram และ Facebook ซึ่งหากขออนุญาตในข้อตกลงการใช้งานต่างๆ เอาไว้ก็น่าจะนำข้อมูลมาฝึกได้ ขณะที่ OpenAI ไม่มีแพลตฟอร์มที่มีคนสร้างคอนเทนต์ให้จำนวนมากๆ มีเพียง ChatGPT ที่มีผู้ใช้จำนวนมาก แต่ก็เป็นเนื้อหาที่สร้างจากปัญญาประดิษฐ์เอง

ที่มา - New York Times

Hiring! บริษัทที่น่าสนใจ

Data Wow Co.,Ltd

We enable our clients to realize increased productivity by solving their most complex issues by Data

Fastwork Technologies

Fastwork.co เว็บไซต์ที่รวบรวม ฟรีแลนซ์ มืออาชีพจากหลากหลายสายงานไว้ในที่เดียวกัน

CP AXTRA Public Company Limited - Lotus's

CP AXTRA Lotus's is revolutionizing the retail industry as a Retail Tech company.

Comments

By: Tasksenger on 8 April 2024 - 10:26 #1309440

อันนี้ผมสงสัยส่วนตัวนะ ใครมีความรู้แนะนำหน่อยแล้วกันครับ ถ้าเราไม่ได้จับ Stream ของ Youtube โดยตรง แต่ให้กล้องเว็บแคมตั้งหน้าจอมอนิเตอร์แล้วให้ AI เรียนรู้จากข้อมูลตรงหน้าโดยใช้ Stream จากเว็บแคม แล้วบันทึกเฉพาะผลลัพธ์จากการประมวลผล Stream เช่น ข้อมูล Object ที่ประมวลผลได้ ความสัมพันธ์ระหว่าง Object ลง Dataset ที่จะนำไปเทรนโมเดล (ถ้านึกไม่ออกก็เหมือนเรานั่งดูหน้าจอ แล้วก็สรุปในใจนั่นแหล่ะครับ) มันผิดเงื่อนไขของ Youtube ไหม ผมก็ไม่เคยอ่าน Agreement ของ Youtube แบบเต็มๆ สักที ความคิดส่วนตัวผมมันก็น่าจะผิดเพราะมันมีการสำเนาในหน่วยความจำ แต่อีกใจนึงก็ว่ามันก็น่าจะเป็นสีเทาๆ อยู่

By: chieffy on 8 April 2024 - 12:25 #1309448 Reply to:1309440

ต้องถามว่าหนังซูมผิดไหมในด้านจริยธรรม แบบเดียวกันครับ แต่ปัญหาคือ 1 ล้านชั่วโมง = 100 กว่าปี การแปลงเนื้อหาเป็น text ยังไงก็นาน งงกะข่าวมากว่าทำไมไม่ใช้คำบรรยายวะ แล้ว NY เจ้านี้เล่นใหญ่โดนตอกกลับเงียบๆไปตั้งกะเรื่องกล่าวหาเขาแต่ตัวเองไม่มีหลักฐานที่ AI แสดงผลที่เชื่อถือได้ (ประวัติแชท-share link ) แถมเนื้อหาก็เป็นเนื้อหาเก่าที่หมดคุณค่าทางข่าว รอบนี้เล่นดูด youtube และเนื้อหาในยูทูปที่เป็นสาระส่วนใหญ่ไม่ใช่เนื้อหาที่มีคุณค่าที่เป็นต้นตำรับเลย ให้นึกเท่าไรก็นึกไม่ออก อย่างนาย 9 ก็เอาข่าวสารรอบตัวมาวิเคราะห์หากมีข้อมูลมากๆใส่ logic ให้ดีๆ มันก็วิเคราะห์ได้ไม่ต้องไปเรียนเลย หรือคอนเทนต์ประเภทสาระคดีก็เน้นนำเสนอภาพ คำบรรยายบางทียังไม่ต้องมีเลย อีกอย่างการแปลงภาพเคลื่อนไหวเป็นการบรรยายเองคิดว่ามันยากไหมอะ คำกล่าวหานี้ NY ทำพลาดอีกแล้ว

By: Tasksenger on 8 April 2024 - 17:10 #1309466 Reply to:1309448

ผมว่าผมก็อ่านคำตอบของคุณแล้วผมก็งง นะ คือ การเรียนรู้จาก VDO มันก็มีข้อดีของมัน เช่น เราให้แขนหุ่นยนต์เรียนรู้จากการเคลื่อนไหวตัวอย่างภาพ VDO ที่อัดไว้กับตัวต้นแบบ เพื่อให้มันเรียนรู้องศาการขยับ หรือทิศทางที่เราต้องการให้มันกระทำกับวัตถุ ซึ่งตรงนี้คำบรรยายมันทำไม่ได้ แล้วแปลงโครงสร้างภาพจาก VDO ให้เป็น Simulation (ปัจจุบัน API ของ Google มันสามารถทำ Skeleton ของมือในการเคลื่อนไหวได้แล้ว ดังนั้นการจำลอง Skeleton จากภาพ VDO ไปเป็น Simulation ไม่ใช่อะไรที่เกินจริงเลย มันเหมือนการตั้งโจทย์ให้แขนหุ่นยนต์จาก VDO แล้วให้แขนหุ่นยนต์ไป Simulation ตามโจทย์ในโลกเสมือน เพื่อหาความเป็นไปได้ว่าจะต้องควบคุมมอเตอร์อย่างไรให้ได้ผลอย่างที่เห็นในภาพในวีดีโอ )

ทั้งนี้ก็เพื่อให้ robot หาความน่าจะเป็นเพิ่มเติมในการเคลื่อนไหวจากการทำ Simulation ตัวเองในโลกเสมือน แล้วตอนนี้ก็มีบางจ้าวก็กำลังทดลองใช้วิธีนี้เหมือนกันในการทำ model ต้นแบบสำหรับแขนหุ่นยนต์ที่มีความละเอียดสูง เพราะการที่เราจะโปรแกรมเองมันใช้เวลามากกว่านั้นเยอะ แล้วทำซ้ำยาก แต่ถ้าให้มันแปลจาก VDO ได้ และแปลงข้อมูลภาพให้เป็น dataset สำหรับเคลื่อนไหว เพื่อเข้าสมการว่าทิศทางที่ถูกต้องเป็นอย่างไรจากการ Simulation มันก็แทบจะไม่ต้องโปรแกรมอะไรเพิ่มเลย

https://www.youtube.com/watch?v=Jy3zjXK4ao4

By: mr_tawan

on 8 April 2024 - 13:41 #1309453 Reply to:1309440

ผมว่า เค้าดูวัตถุประสงค์มากกว่าวิธีการนะครับ ?? ลองอ่านข้อตกลงการใช้งานของ Youtube ก่อนว่าเขาระบุไหมว่าเอาไปทำอะไรได้บ้างน่ะครับ

9tawan.net บล็อกส่วนตัวฮับ

By: MrThursday

on 8 April 2024 - 14:07 #1309456 Reply to:1309440

กฎหมายที่ใช้กับมนุษย์ไม่ควรเอาไปใช้กับ AI ครับ เพราะความสามารถต่างกันมาก ไม่มีมนุษย์คนไหนดูวิดีโอหลักแสนหลักล้านเรื่องได้ภายในเวลาสั้นๆครับ ยังไม่นับเรื่องความจำที่ทนทานต่างกว่ากันมาก ดังนั้น การเอากฎหมายที่มนุษย์ใช้ไปใช้กับ AI มันจะเบามากครับ กลายเป็นกว่า AI จะทะลุข้อจำกัดที่กฎหมายคุ้มครองมนุษย์ไว้ครับ

By: gudgee

on 8 April 2024 - 20:15 #1309470 Reply to:1309456

เห็นด้วยครับ

By: Jirawat

on 10 April 2024 - 03:48 #1309541

เมื่อไรกฏหมายAI จะออกน้อมัวทำอะไรกันอยู่ เทรนดาต้ากันสนุกเลย ผิดถูกไม่รู้ เทรนไว้ก่อน😂

Main menu