Tags:
Node Thumbnail

ทีมนักวิจัยของ OpenAI เผยแพร่งานล่าสุด เพื่อทดสอบว่า AI จะสามารถเรียนรู้และพัฒนาได้มากแค่ไหนหากอยู่ในสภาพการแข่งขันบนโลกเสมือน โดยอาศัยการเรียนรู้สองส่วน คือ multi-agent learning ซึ่งพัฒนาขึ้นเรื่อย ๆ ผ่านการแข่งขันกับคนอื่น และ reinforcement learning จากการลองผิดลองถูกจนเข้าใจมากขึ้น

วิธีการทดสอบนั้นทีม OpenAI สร้างเกมซ่อนหา (hide and seek) ในโลกเสมือนที่มีกำแพง และอุปกรณ์หลายชนิด สามารถเคลื่อนย้ายได้เพื่อบังพื้นที่ มีตัวทดสอบ (agent) แบ่งออกเป็นสองทีม กำหนดกติกาคือ ฝ่ายซ่อนต้องพยายามหลบให้ได้ ส่วนฝ่ายหาต้องหาอีกฝ่ายให้เจอ จึงจะได้รางวัลหรือถูกลงโทษ และไม่มีการสอนกติกาอื่นเพิ่มเติมเพื่อให้เรียนรู้เองเรื่อย ๆ

alt="OpenAI 1"

ผลทดลองพบว่าตัวทดสอบมีการเรียนรู้และปรับกลยุทธ์ขึ้นเรื่อย ๆ ช่วงแรกทุกคนก็แค่พยายามซ่อนและหาไปตามปกติ จนเมื่อถึงเกมที่ 25 ล้าน ฝ่ายซ่อนเริ่มนำกล่องมาบังไม่ให้ฝ่ายหาหาเจอ รวมทั้งช่วยนำกล่องไปบังให้เพื่อนในทีมด้วย

เมื่อถึงเกมที่ 75 ล้าน ฝ่ายหาเริ่มปรับแผน นำทางลาดมาเสริมเพื่อปีนไปหาฝ่ายซ่อนที่หลบอยู่ พอเข้าสู่เกม 85 ล้าน ฝ่ายซ่อนก็เริ่มเกมด้วยการล็อกทางลาดไม่ให้ฝ่ายหาเคลื่อนย้ายมาใช้งานได้

alt="OpenAI 2"

เกมดำเนินรูปแบบนี้จนดูเหมือนจะสิ้นสุดรูปแบบแล้ว แต่พอเข้าช่วงเกมที่ 380 ล้าน ฝ่ายหาก็พบวิธีการใหม่โดยปีนอยู่บนกล่อง แล้วไถกล่อง จากนั้นกระโดดข้ามสิ่งกีดขวางที่ฝ่ายซ่อนวางไว้ เพื่อเข้าไปจับตัวจนได้ เวลาต่อมาฝ่ายซ่อนจึงเริ่มเกมด้วยการล็อกอุปกรณ์ทุกอย่างไม่ให้ฝ่ายหาใช้งานได้ก่อน

alt="OpenAI 3"

สิ่งที่ได้จากงานวิจัยพบว่า AI ในสภาวะการแข่งขันที่มีตัวทดสอบหลายตัว จะเกิดการสร้างวิธีการใหม่ร่วมกัน ตลอดจนเรียนรู้จากคู่แข่งตลอดเวลาเพื่อมาปรับใช้ โดยสามารถจินตนาการต่อได้ว่าในสภาวะที่มีการแข่งขันแต่ซับซ้อนมากกว่านี้ AI อาจค้นพบวิธีการแก้ปัญหาแบบใหม่ที่คนคิดไม่ถึงมาก่อนเลยก็เป็นได้

ที่มา: MIT Technology Review

Get latest news from Blognone

Comments

By: HudchewMan
ContributorAndroidWindowsIn Love
on 19 September 2019 - 08:30 #1128982
HudchewMan's picture

อ่านแล้วทำให้อยากดูวิดีโอเลย ?

Multi-Agent Hide and Seek
https://www.youtube.com/watch?v=kopoLzvh5jY


~ HudchewMan's Station & @HudchewMan~

By: 100dej
AndroidWindows
on 19 September 2019 - 09:11 #1128985

ปีนกล่องได้ ทำไมไม่ปีนกำแพง

By: itnas on 19 September 2019 - 10:17 #1128992 Reply to:1128985

ดูจาก วีดีโอ ผมไม่เห็นปีนกล่องนะ ต้องมีทางลาดเอียงมาพาดขึ้นกล่อง

By: Auftrag on 19 September 2019 - 11:44 #1129013 Reply to:1128992
Auftrag's picture

ยืนบนกล่องแล้วก็พากล่องเดินได้ 5555

By: geumatee
ContributoriPhoneAndroidWindows
on 19 September 2019 - 11:54 #1129021 Reply to:1128985

ไม่ได้ปีนกล่องครับ แค่ลากกล่องไปที่ทางลาด(ที่ถูกล๊อกไว้ไม่ให้ลาก) แล้วเดินขึ้นกล่องจากทางลาดนั้น แล้วขยับกล่องโดยการยืนอยู่บนกล่องแล้วไถๆไปกับกำแพง

By: 100dej
AndroidWindows
on 19 September 2019 - 14:20 #1129058 Reply to:1129021

ดูวิดีโอล่ะ box surfing
ไถกล่องนี่มันโกงไปหน่อยนะ -_-

By: madmod on 19 September 2019 - 13:42 #1129044

อีก10000ล้าน ครั้ง ฝ่ายซ่อนเริ่ม เอากำแพงกั้น ฝ่ายหา และล็อก ให้เรียบร้อย
555

By: Nube on 19 September 2019 - 14:07 #1129052
Nube's picture

อีก 100000 ล้านครั้ง ฝ่ายหาเริ่มแฮกเกมส์เอากำแพงออก จะได้ไม่ต้องมีที่ซ่อน

By: hisoft
ContributorWindows PhoneWindows
on 19 September 2019 - 14:29 #1129061
hisoft's picture

ตอน 2:05 นี่ผมนึกว่าจะเอาแผงไปปิดคนหาล็อคไว้ข้างในแล้ว ?

By: SomeThing
Windows
on 19 September 2019 - 15:19 #1129066

ทำไมนึกถึง Dr.Strange มี 14 ล้าน ..

By: delete on 19 September 2019 - 17:02 #1129089

แปลกใจตรงที่ต้องถึงหลักล้านครั้งเลยรึครับ กว่าai จะปรับเปลี่ยน หรือเรียนรู้
แต่ ในข้อเท็จจริง มันอาจจะเสี้ยววินาทีของความเป็นจริงก็เป็นได้

By: oDestroyeRo
iPhoneWindows
on 19 September 2019 - 17:59 #1129102 Reply to:1129089

คือ action มันเยอะและมี action ที่ทำงานไปพร้อมๆกันทำให้ condition ที่เป็นไปได้ค่อนข้างเยอะครับ ส่วนจำนวนครั้งไม่ใช่ปัญหาครับ ตราบใดที่มันยังเรียนรู้ได้อยู่

By: pepporony
ContributorAndroid
on 19 September 2019 - 18:33 #1129105 Reply to:1129089

แบบเริ่มมาครั้งแรก แค่เดินออกมา อ้าว เจอแล้ว (จบครั้งที่ 1)