OpenAI บริษัทพัฒนาปัญญาประดิษฐ์ที่ก่อตั้งโดย Elon Musk สาธิตเทคนิคการฝึกปัญญาประดิษฐ์เพื่อควบคุมหุ่นยนต์ในโลกความเป็นจริง โดยสร้างโมเดลปัญญาประดิษฐ์ที่มีความซับซ้อนสูง ผ่านการสร้างโจทย์ให้หุ่นยนต์มือเดียวต้องแก้ปัญหารูบิก
โมเดลปัญญาประดิษฐ์จะถูกฝึกในซอฟต์แวร์จำลองหุ่นยนต์เท่านั้น เท่าให้สามารถบอกปัญญาประดิษฐ์ได้ว่าแก้ปัญหาลูกรูบิกสำเร็จหรือยัง แต่อาศัยการสร้างสภาพแวดล้อมที่เปลี่ยนไปแต่ละรอบ (domain randomization) เพื่อให้โมเดลปัญญาประดิษฐ์ทนทานต่อความไม่แน่นอนในโลกความเป็นจริง โดยการวิจัยครั้งนี้ทาง OpenAI สร้างสภาพแวดล้อมที่เปลี่ยนไปเรื่อยๆ โดยเรียกว่าเทคนิค Automatic Domain Randomization (ADR)
ADR สร้างสภาพแวดล้อมที่เปลี่ยนไปเรื่อยๆ เช่น ขนาดลูกรูบิกที่เปลี่ยนไปเรื่อยๆ เพื่อให้โจทย์ยากขึ้นเรื่อยๆ สำหรับโมเดลปัญญาประดิษฐ์ โดยไม่ต้องให้นักวิจัยมากำหนดพารามิเตอร์ล่วงหน้า
หลังจากนำโมเดลมารันบนหุ่นยนต์จริงแล้ว นักวิจัยทดสอบความทนทานของโมเดลด้วยการเปลี่ยนสภาพแวดล้อมแบบใหม่ๆ เช่นการมัดนิ้วของมือหุ่นยนต์, เอาตุ๊กตาไปขยับลูกรูบิก, หรือเอาผ้าไปคลุมมือหุ่นยนต์ และพบว่าโมเดลยังคงแก้ปัญหาได้ดีกว่าที่คาดไว้
อัตราการแก้ปัญหาสำเร็จของโมเดลปัญญาประดิษฐ์อยู่ที่ 20% หากลูกรูบิกเริ่มต้นหมุนไว้ให้ต้องหมุน 26 ครั้งจึงแก้ได้ ขณะที่อัตราการแก้สำเร็จจะเพิ่มขึ้นเป็น 60% เมื่อลูกรูบิกต้องหมุน 15 ครั้งจึงแก้ได้
ที่มา - OpenAI
Comments
อันนี้คือโหด โหดมากๆ โหดสุดจริงจังเลยครับ
โหหหหด
หาลูกรูบิก > หากลูกรูบิก
โหดมากขนาดโดนกวนยังแก้จนเสร็จได้
โดยฝึกในซิมอย่างเดียว
ซิม นี้คือที่ไหน
simulation ?