หลังจากที่เปิดตัวอย่างสวยงามในการเอาชนะผู้เล่นมืออาชีพ ทางทีมงาน OpenAI ก็เปิดให้ผู้ร่วมงาน The International 2017 ลองแข่งกับบอทตัวนี้ ผู้ชนะจะได้รางวัลเป็นไอเท็ม Arcana ของฮีโร่ Shadow Fiend และรางวัลทั้ง 50 ชิ้นนั้นมีผู้ได้รับไปเป็นที่เรียบร้อยแล้ว
สำหรับวิธีเอาชนะ OpenAI ผู้ใช้งาน Reddit ที่ชื่อว่า menohaxor หนึ่งในผู้ชนะ มาเผยกลยุทธ์ของเขาผ่านกระทู้บน Reddit ดังนี้
ภาพก่อนการแข่งขันระหว่าง Danylo "Dendi" Ishutin ผู้เล่นมืออาชีพ และ OpenAI
ดูเหมือนว่าความคิดที่เหนือความคาดหมายยังคงทำให้มนุษยชาติมีความหวังในการเอาชนะ AI และทางทีม OpenAI น่าจะต้องกลับไปทำการบ้านเพิ่มในการรับมือกับเกมที่มีมิติซับซ้อนแบบ Dota 2
ที่มา: Reddit, Twitter: @riningear
Comments
ถ้าจะเอาชนะ AI ต้องใช้จุดแข็งของมนุษย์ ซึ่งคนทั่วไปคิดว่าเป็นจุดอ่อน รวมถึงคนที่สร้าง AI ขึ้นมาก็จะคิดเช่นนั้น พฤติกรรมความไม่แน่นอนแบบสุ่มเป็นพฤติกรรมติดตัวมนุษย์ แต่มันเป็นเส้นทางสร้างวิธีการใหม่ขึ้นมา คนทั่วไป 80% มักเล่นเลียนแบบคนที่เคยเล่นชนะ แต่จะมีคนกลุ่มนึงจะเล่นด้วยรูปแบบไม่แน่นอน แต่วางแผนผลลัพธ์สุดท้ายซ่อนเอาไว้ หนังจีนเรียกว่า กระบี่ไร้กระบวนท่า แต่ฆ่าตายเรียบ เพราะมีกระบวนท่า AI จะ Match pattern ได้ AI สมัยนี้ยังมีจุดอ่อนเรื่องการคิดวิธีใหม่ๆ จากประสบการณ์ที่เรียนรู้มา
ข้อจำกัดของ ai ตอนนี้น่าจะยังต้อง learn นอกเกมเพื่อมาสร้าง model มากกว่า
ถ้า model มีจุดอ่อน ก็จะไม่สามารถแก้ไขได้
แต่ถ้าเอาวิธีการเล่นแมทช์นั้นไป learn ก็ไม่น่าจะใช้ซ้ำได้
(ท่าไม่ตายเดิมใช้กับเซนต์ซ้ำสองไม่ได้?)
ถ้าวันนึงกระบวนการ learn สามารถทำ realtime ได้ก็น่ากลัว
นึกถึงการ์ตูนเรื่องหนึ่งจำชื่อไม่ได้ละ ที่แต่ละทีมเป็นหุ่นยนต์แล้วลงแข่งฟุตบอลกัน
โลกในอนาคตเราอาจดู AI แข่งกันก็ได้ เชียร์ว่า AI ของฝั่งไหนจะเจ๋งกว่ากัน
Iron Leaguer ?
samsung ใหญ่แค่ใหน ?
https://youtu.be/6Afpey7Eldo
เรื่องนี้ละ
ผู้รักษาประตูฝั่งตัวตรงข้าม เล่นกางสนามแม่เหล็กไฟฟ้าบ้องกันประตูไม่ต้องขยับไปไหนเลย อย่างโกง
แล้วก็จะมี AI ลึกลับโผล่มาพร้อมกับท่าไม้ตาย 44 sonic
อ่านเจอในหนังสือ(การ์ตูน) พวกที่เก่งมากๆทำทุกอย่างได้สมบูรณ์แบบหมดทุกอย่างเหมือน AI เนี่ยจะมีจุดอ่อนตรงที่เราจะคาดการณ์ได้เลยว่ามันจะทำอะไรต่อไป เพราะมันต้องทำไอ้สิ่งที่คิดว่าดีที่สุดนี้ออกมาแน่ๆ เราขยับแบบไหนมันก็จะทำสิ่งที่มันคิดว่าดีที่สุดออกมากลับคืน"จะไม่ใช่การสุ่มตอบแทนมาแน่นอน" แปลว่าเราก็สามารถชักใยมันได้กลายๆ พอรู้งี้เราก็สามารถชนะมันลงได้ง่ายๆแบบนี้แหละ
ตอนกรณี alphago สำหรับนักเล่นหมากล้อมคนอื่นก็คิดแบบนั้นครับ แต่ผลลัพท์เหรอ เดินหมากอะไรออกมาก็ไม่รู้ กว่าจะรู้เป้าหมายก็โดนแย่งลมหายใจไปหมดล่ะ จะต้านกระแสหมากก็กุมหัวเลย
จริงๆ คำว่าสิ่งที่ดีที่สุด ของมนูษย์น่ะมันไม่เหมือน AI ครับ เพราะอย่างคนเรา มีประสบการณ์ๆ เล่นหมากก็ตีสัก 30-40 ปี แต่ AI น่ะมันมีประสบการณ์เล่นหมากเยอะกว่าคนมากหลายร้อยเท่า
คิดว่าคนอัจฉริยะอายุ 100 ปีั จะคาดการณ์คำตอบจากคนธรรมดาอายุ 1000 ปีได้หรือเปล่าครับ AI จริงๆ มันก็แบบนั้นแหละ
และตลกร้ายสุดคือ AI ใช้เวลาเรียนรู้ 1000 ปีกับตัวเองที่ถูกโคลนมาเสมอ ซึ่งถ้าทุกสิ่งคาดการณ์ได้ AI ที่แข่งกับตัวเองก็ควรจะไม่พัฒนาสิ จริงไหม?
alphago แข่งกับตัวเองทั้งหมด 1.2 ล้านตา เกมแต่ล่ะตาถ้าคนเล่น เฉลี่ย 1 ชั่วโมง ถ้าเป็นคนปกติ วันหนึึ่งเล่นสัก 12 ชั่วโมง ก็ต้องใช้เวลาเล่นสัก 270 ปี (ตายไปซะก่อน)
ปล. ผมเคยเล่นโกะ แค่ 4 ชั่วโมงผมก็เครียดล่ะ
มันไม่ง่ายเลยที่จะทำ GIF ให้มีขนาดน้อยกว่า 20kB
ตามที่ผมเม้นในข่าวก่อนครับ ประเด็นคือเขาไม่ได้พัฒนา AI ที่เรียนรู้ได้เองจริงๆ แต่ใช้การกำหนดพฤติกรรมเพื่อให้บอทเรียนรู้
ตามความคิดผม บอทมันก็จะเก่งก็เฉพาะกับพฤติกรรมที่ถูกกำหนดขึ้นมานั่นแหละ ถ้าหากมีพฤติกรรมเหนือความคาดหมายทีมพัฒนาก็ต้องไล่กำหนดพฤติกรรมเหล่านั้นไปเรื่อยๆเพื่อให้มันเก่งขึ้น จุดนี้แหละคือสิ่งสำคัญในการแก้ปัญหาด้วย AI
ต้องรอดูทีม AlphaGo ทำบอท Starcraft หรือรอดูว่าทีม OpenAI จะปรับบอท Dota2 อย่างไรต่อไป
สรุปคือบอทตัวนี้เก่งเพราะมนุษย์เทรน รอดู starcraft ของ deepmind ดีกว่า รู้สึกอันนั้นบอทจะเรียนรู้ด้วยตัวเองทั้งหมด ตั้งแต่การจับเมาส์เลย