Meta AI รายงานถึงการพัฒนาระบบปัญญาประดิษฐ์ data2vec ที่เป็นปัญญาประดิษฐ์แบบสอนตัวเอง (self-supervised) ทำให้สามารถฝึกปัญญาประดิษฐ์ให้เก่งขึ้นเรื่อยๆ จากข้อมูลเพิ่มเติม โดยที่ข้อมูลเหล่านั้นไม่ต้องการเฉลย (label) ที่ปกติต้องให้มนุษย์เตรียมข้อมูลให้
จุดเด่นของ data2vec คือเป็นสถาปัตยกรรมที่ใช้งานกับได้ข้อมูลเสียง, ภาพ, และข้อความได้พร้อมกัน และยังได้ผลลัพธ์ที่ดีกว่าโมเดลแบบเดิมๆ
data2vec อาศัยการแยกโมเดลที่ต้องการฝึกออกเป็นสองชุด คือ นักเรียนและครู ที่จริงๆ แล้วเป็นโมเดลปัญญาประดิษฐ์แบบเดียวกัน แต่ปัญญาประดิษฐ์ที่ทำหน้าที่ครูนั้นเป็นเวอร์ชั่นเก่ากว่า จากนั้นแบ่งข้อมูลออกเป็นสองชุด ครูจะเห็นข้อมูลอินพุตเต็ม แต่นักเรียนจะเห็นข้อมูลที่ถูกบังไว้บางส่วน เช่นหากเป็นภาพก็ถมดำ หรือหากเป็นข้อความก็ตัดบางคำทิ้งเสีย จากนั้นให้โมเดลทั้งสองพยายามทำนายเอาท์พุตให้เหมือนกัน
ทีมงานระบุว่าแนวทาง self-supervise d น่าจะเปิดทางให้การพัฒนาปัญญาประดิษฐ์กับงานประเภทอื่นๆ (วิดีโอ, บทความ) ได้โดยใช้ข้อมูลที่เตรียมเฉลย (label) เพียงเล็กน้อย และปัญญาประดิษฐ์ควรสามารถเรียนรู้หาสิ่งที่ไม่เคยมีเฉลย เช่น จัดหมวดหมู่สัตว์ที่ไม่เคยเจอได้ด้วยตัวเอง
ที่มา - Meta AI
Comments
self-supervise d >> self-supervised
ฟังดูเสี่ยงออกทะเลมาก ปล่อยให้เทรนจนรายงานว่าแม่นยำสุด ๆ แต่พอคนมาดูผลลัพธ์แล้วก็ WTF