Tags:
Node Thumbnail

หลังจากที่ฝั่ง Deepmind ได้ออกมาประกาศการร่วมมือกับ Blizzard เพื่อพัฒนา AI ของเกม StarCraft ล่าสุด บอทจาก OpenAI โปรเจ็คท์ AI ที่ไม่แสวงหาผลกำไรของ Elon Musk จาก Tesla และ Sam Altman จาก Y Combinator ได้เอาชนะผู้เล่นมืออาชีพในการแข่งขันเกม Dota 2 แบบ 1 ต่อ 1 กลางงาน The International 2017

การแข่งขันดังกล่าวเป็นการพบกันระหว่าง OpenAI กับ Danylo "Dendi" Ishutin ผู้เล่นมืออาชีพจากทีม Natus Vincere โดยแข่งขันกับแบบ 1 ต่อ 1 ด้วยฮีโร่ Shadow Fiend ซึ่งฝ่าย OpenAI เอาชนะไปได้ในเกมที่ 1 ฝ่ายมนุษย์ขอยอมแพ้ในเกมที่ 2 และ ปฏิเสธที่จะเล่นในเกมที่ 3

alt="upic.me"

Greg Brockman CTO ของ OpenAI กล่าวผ่านวิดีโอแนะนำบอทตัวนี้ว่า บอทตัวนี้ถูกฝึกให้แข่งกับตัวเองเป็นเวลากว่า “หนึ่งพันชั่วอายุคน”​ พร้อมการโค้ช นอกจากนี้ Brockman ยังได้กล่าวผ่าน Blog ของ OpenAI เพิ่มเติมว่า ในช่วงอาทิตย์ที่ผ่านมา OpenAI ไม่แพ้ใครเลยในการเจอกันกับผู้เล่นระดับโลกคนอื่นๆ อย่าง Syed Sumail "SumaiL" Hassan และ Artour "Arteezy" Babaev และ ภายใน Blog ยังมีวิดีโอนำเสนอถึงพฤติกรรมที่ให้บอท OpenAI ได้เรียนรู้เกี่ยวกับเกม Dota 2 อีกด้วย

สุดท้าย Brockman มองว่า OpenAI ยังไม่พร้อมสำหรับการแข่งขันแบบปกติของ Dota 2 คือ 5 ต่อ 5 และเขาหวังว่าจะสามารถพัฒนาบอทตัวนี้ให้พร้อมสำหรับการแข่งขันได้ภายในปีหน้า

สามารถรับชมคลิปการแข่งขันแบบเต็มๆ ได้ ที่นี่

ที่มา: Business Insider, NoobFromUA

Get latest news from Blognone

Comments

By: Rapier
AndroidWindows
on 12 August 2017 - 09:17 #1002206
Rapier's picture

อันนี้ Trailer ก่อนแข่งครับ Hype มาก
https://clips.twitch.tv/ManlyJollyAnteaterTwitchRPG

By: thanyadol
iPhone
on 12 August 2017 - 09:20 #1002207

lol dendi, lol sumail

By: kora on 12 August 2017 - 09:33 #1002208

AI ได้เปรียบ เพราะ กดได้เร็วกว่า

By: MrThursday
ContributorRed HatUbuntuWindows
on 12 August 2017 - 14:32 #1002257 Reply to:1002208

ผมว่าเขาต้องใส่ค่าหน่วงไปแล้วแหละครับ

By: tekkasit
ContributorAndroidWindowsIn Love
on 12 August 2017 - 16:50 #1002272 Reply to:1002208
tekkasit's picture

เค้าล็อค APM ไว้ให้อยู่ในระดับมนุษย์ (our AI’s actions-per-minute are comparable to that of an average human player) ครับ

By: Mr.X
iPhoneAndroid
on 12 August 2017 - 09:42 #1002209

ผมนั่งดูสดๆ บน twitch มันหลอนนะครับบอกเลย
เหมือนอะไรสักอย่างที่มีพลัง ความสามารถที่ ข้ามมนุษย์ไปไกล

และที่สุดเลยต้องที่เขาบอกไว้ว่า เขาให้บอทเรียนรู้จากตัวมันเอง
ไม่ได้ใช้ความรู้จากที่มนุษย์สะสมไว้เลย และสะสมความรู้จากการสู้กับตนเอง
จนสามารถก้าวข้าวโปรเพลเยอร์ไปได้

ซึ่งถ้าเทียบกับ alpha go นั่นยังใช้ pattern จากที่คนเล่นกันมาเอามาเทรนตอนเริ่มต้น
แต่นี่ไม่ใช่ AI สร้างทักษะ และความชำนาญจากด้วยมันเอง from scratch กันเลยทีเดียว

ซึ่งถ้าจริงอย่างที่เขาบอก นีั่หน่ะมันหลอนเลยหล่ะครับ
และก็ไวมาก จริงอย่างที่ Elon ว่าไว้ มนุษย์ต้องเริ่มกังวล AI บ้างแล้ว

ซึ่งไม่ใช่เรื่องแปลก มนุษย์จะกลัวอะไรที่เกินกว่าความสามารถของตัวเอง
จนกว่ามนุษย์จะมั่นใจได้ว่า มันถูกคุมอยูู่

By: Ashirogi on 12 August 2017 - 09:43 #1002210

สักพักจะมาเป็นทีมไหมเนี่ย

By: BlackMiracle
WriterAndroidUbuntuWindows
on 12 August 2017 - 09:44 #1002211

ไม่ต้องแซะ AlphaGo ก็ได้นะ -_-


Pitawat's Blog :: บล็อกผมเองครับ

By: mehn
iPhone
on 12 August 2017 - 09:52 #1002214
mehn's picture

ทำไมรู้สึกไปเองว่า... มันก็น่าชนะแหง่ๆ อยู่แล้ว

คือรู้สึกว่าทั้งส่งคำสั่งเร็วกว่า ตำแหน่งคู่แข่ง/ไอเทม/ตัวละครในทีมอะไรต่างๆ AI จำได้ดีกว่าคนอยู่แล้ว
แถมเกมก็เน้นตัดสินใจเร็วอีก AI ย่อมตัดสินใจดีกว่าแม่นยำกว่าอยู่แล้ว

By: Mr.X
iPhoneAndroid
on 12 August 2017 - 10:22 #1002222 Reply to:1002214

ผมไม่มองแบบนั้นเลยนะ ผมมองว่าการตัดสินใจนี่แหละ ที่มนุษย์เรามั่นใจมากกว่า
และเกมส์นี้มันวัดการตัดสินใจ ณ เวลาหนึ่งๆ สามารถจะเลือกทำอะไรได้เยอะมาก เดินซ้ายขวา deny หรือว่าจะ last hit จะบุก จะหนี เดินเข้าไป ตัดขวดศัตรูดีมั้ย สกิล ใกล้ กลาง ไกล จะใช้อะไรก่อน
มันเหมือนมีข้อมูล ประดังเข้ามาแล้วต้องตัดสินใจจากประสบการณ์
ซึ่งนั่น ไม่เคยมีบอทไหนทำได้มาก่อน คุณลองคิดดูถ้าให้คุณเขียน if then else มันจะทำได้ยังไง

ถ้าไม่เชื่อที่ผมว่า ก็ลองดูปฏิกิริยาของโปรเพลเยอร์ได้ ก่อนเล่นมั่นใจกันทั้งนั้น

By: flittleconan
AndroidUbuntuWindows
on 12 August 2017 - 10:54 #1002224 Reply to:1002222

การตัดสินใจคิดจากอะไร เลือดที่เหลืออยู่ เกราะ แล้วก็เดเมจที่ตัวเองมี เพลเยอร์ทุกคนก็ตัดสินใจอย่างนี้ ยิ่ง 1v1 ไม่ใช่ team play ยิ่งใช้การคำนวณเยอะ เพราะไม่มีปัจจัยอื่นๆ มาเกี่ยวข้อง มันก็ไม่เห็นจะแปลกที่ Bot จะชนะ Esports 1-1 เป็นอะไรที่ bot ชนะง่ายที่สุดแล้ว แถมมนุษย์ก็มีปัจจัยด้านอารมณ์ หัวร้อน Tilted ง่ายๆอีกต่างหาก

ปล. ถ้าเกิดก่อนเล่นไม่มั่นใจ มันก็แพ้ไปค่อนตัวแล้วปะครับ?

ปลล. ในกฎห้ามใช้ Bottle runes ลดปัจจัยได้อีกเยอะ

By: Mr.X
iPhoneAndroid
on 12 August 2017 - 11:13 #1002225 Reply to:1002224

คือ ผมเข้าใจว่า ไอกติกานี่หน่ะ มันชนะได้ง่ายที่สุดแล้ว (คำที่น่าจะเหมาะกว่าคือ ยากน้อยที่สุด)
แต่มันก็ยังไม่ง่ายอยู่ดี ที่จะเขียนบอทให้ชนะ เพราะบอทมันไม่ได้ใช้ ข้อมูลกลยุทธิ์จากประสบการณ์คน

มันแข่งของมันเอง มันให้รางวัลตัวเองเมื่อผลดี มันลงโทษตัวเองเมื่อแพ้ แล้วจากนั้นก็สร้างความรู้ ข้อมูลของมันเอง
ตรงนี้ต่างหาก ที่มันยาก

ถึงยังไงผมจะรออ่านเปเปอร์อีกที ว่าเขาป้อนอะไรบ้างเป็น input และ output ของบอทนั่นทำอย่างไร

ซึ่งอะไรที่มาถึงวันนี้ได้ ไม่แน่ใจว่าในอนาคตอาจจะมี 5v5 พร้อมกับใส่ดีเลย์ ใน input ของมันก็ได้
และจุดนั้นแหละ คือจุดที่บอกได้ หุ่นยนต์ได้ไปไกลกว่ามนุษย์แล้ว ในการคิดค้นกลยุทธ์ต่างๆ ในสถานการณ์ที่ซับซ้อน

By: mk-
Symbian
on 12 August 2017 - 23:38 #1002316 Reply to:1002214
mk-'s picture

คิดเหมือนกัน เป็นเกมส์ที่ใช้ความเร็วของปฏิกิริยาตอบสนองสูง ในขณะที่กลยุทธไม่ได้เยอะหรือซับซ้อนเท่าไหร่
บอทได้เปรียบ

By: whitebigbird
Contributor
on 12 August 2017 - 09:55 #1002215
whitebigbird's picture

"ของยอมแพ้" -> ขอ

By: geekjuggler
WriteriPhone
on 12 August 2017 - 11:40 #1002232 Reply to:1002215
geekjuggler's picture

แก้ไขละครับ ขอบคุณครับ


"When I walk around I probably look like a street dog" - Daido Moriyama

By: Hoo
AndroidWindows
on 12 August 2017 - 12:06 #1002234

5-5 น่าจะซับซ้อนสุดๆ
เพราะนอกจากตัวมัน ยังต้องคิดถึงตัวอื่นอีก 9 ตัว
และถ้าไม่ใช่ AI ตัวเดียว คุมทั้ง5ตัวในฝ่ายเดียวกันอาจต้องมีการ chat บอกเพื่อนร่วมทีมได้
เช่น +++, bbb, sad noob wa //เอร๊ยแมวพิมพ์

By: H0RNET
AndroidWindows
on 12 August 2017 - 12:55 #1002242

บอท Chat All> ?
หลัง Kill คนคงจะหัวร้อนน่าดู

By: Hoo
AndroidWindows
on 12 August 2017 - 18:59 #1002285 Reply to:1002242

All> GG EZ LOL

By: Zatang
ContributoriPhoneAndroid
on 12 August 2017 - 13:15 #1002245

หลังจากดูดคลิปแล้วโหดกว่าที่คิดอีก เรื่องลาส ดีไน นี่บอทได้เปรียบอยู่แล้ว แต่นี่มีไล่ มีสกิลหลอก ฯลฯ


อคติทำให้คนรับเหตุผลด้านเดียว

By: zyzzyva
Blackberry
on 12 August 2017 - 14:01 #1002254

อยากอ่านเปเปอร์แล้ว มีใครพอจะทราบมั้ยว่า input ของบอทตัวนี้คือ raw pixel หรืออะไร ถ้าเป็น raw pixel ก็น่าประทับใจมาก

By: KittenWIthoutACause
AndroidWindows
on 12 August 2017 - 14:08 #1002255

ผมสงสัยว่า “หนึ่งพันชั่วอายุคน” ทำได้ยังไงอะ คือบอทโคลนตัวเองเป็นล้านๆตัวแล้ว เก็บข้อมูลไปเรื่อยๆ เหรอครับ

สิ่งที่ผมอยากเห็นอีกอย่างคือ บอท คลิ๊กเม้าส์ยังไง

เอาจริงๆ มันเป็นไปไม่ได้อยู่แล้ว ที่จะชนะ perfect blocking creep แบบนั้น คนไม่มีทางทำได้ มันไม่ใช่สมอง แต่เป็น skill

ไม่ว่าจะ agro creep หรืออะไร คนก็ไม่มีทางที่จะขยับได้ดีกว่าบอท

ผมว่าเกมแรก Dendi สู้ได้ดีมากๆ ดีแบบเหลือเชื่อเลย คือบอทตายพร้อมกับ Dendi แต่ Dendi ตายไปแล้ว 1 ก็คือ บอทมันก็จะจบเกม ก็คือยอมตายด้วย ไม่อย่างนั้นผมเชื่อว่า บอทไม่ตายแน่ๆ

ส่วนตัวผมว่านี่มันเรื่องบ้าๆ จริงๆนะ แค่ perfect blocking creep ได้แบบนั้นก็จบแล้ว

By: ntsd on 12 August 2017 - 16:24 #1002268 Reply to:1002255
ntsd's picture

Reinforcements in simulate 1 billion games with high performance computer.

By: TW
AndroidWindows
on 12 August 2017 - 16:29 #1002270 Reply to:1002255

ก็คงให้บอทเล่นแบบ "ความเร็วสูงสุด" มั้งครับ

เล่นจบ เริ่มใหม่ วนไปเรื่อยๆ คิดเวลาได้เทียบเท่ากับ คนเล่นในเวลาหนึ่งพันชั่วอายุ

ปล. ผมเดา

By: aeksael
ContributoriPhoneWindows PhoneAndroid
on 12 August 2017 - 14:31 #1002256
aeksael's picture

เอาไปไต่ rang หรือเล่นร่วมกะคนอื่นอีก4บ้าง ดิ อยากดู

1-1 มันก็ต้องเก่งดิฝึกมา4หมื่นปี


The Last Wizard Of Century.

By: massacre
AndroidUbuntu
on 12 August 2017 - 15:11 #1002259

ผมว่า 1-1 แบบนี้ alphaGo ยังดูน่าตื่นเต้นกว่าอีก
เกมส์ Dota2 ยังไง bot ก็ได้เปรียบคนเล่นมากกว่ากระดาน go
ุถ้าเอา bot ไปเล่นกับ team คนจริงได้แล้วโหด ยังน่าตื่นเต้นมากกว่า

By: rainhawk
AndroidWindows
on 12 August 2017 - 15:50 #1002263
rainhawk's picture

แค่เวลา input อย่างเดียว ไม่นับ reaction ถ้าฝีมือพอๆกันก็ชนะคนขาดลอยแล้วครับ

By: thanyadol
iPhone
on 12 August 2017 - 15:51 #1002264

เอาจริงดิ ทำไมผมคิดว่า dota2 มันซับซ้อนกว่าเกมส์โก๊ะหว่า
ถ้าดูคลิบจะเห็นว่าเล่นเหมือนคนมาก ไม่ได้มีจุดที่เรียกว่าโกง รอ 5-5 เมื่อไรสนุกแน่

By: tekkasit
ContributorAndroidWindowsIn Love
on 12 August 2017 - 17:54 #1002278
tekkasit's picture

คือเกม DOTA2 พวกนี้เป็นอีกระดับจากโกะหรือหมากรุก ซึ่งเกมกระดานจะเป็น perfect information คือข้อมูลผู้เล่นทุกคนเห็นบนกระดานเท่ากันหมดและเป็นลักษณะผลัดกันเดิน

ส่วนเกมอย่าง DOTA, SC จัดเป็นพวก RTS ซึ่งทางเลือกที่เป็นไปได้แต่ละ move ก็เยอะกว่าเกมกระดาน แถมเป็น real-time อีกต่างหาก AI คิดนานไปก็เสียโอกาสในการทำเกมอีก ยิ่งกว่านั้นพวกนี้จะมี fog of war เข้ามาทำให้ AI ไม่เห็นข้อมูลทุกๆอย่าง ซึ่งข้อมูลส่วนที่มองไม่เห็นสามารถทำให้เกมพลิกผันได้

แต่เหมือนแมตช์นี้ยังมีข้อห้าม เหมือนไม่เห็นการซื้ออาวุธ อัพสกิล ฯลฯ เหมือนเกมปกติ กลายเป็นเดินหน้าลุยตรงๆ ขาดความลุ่มลึกไปเยอะ ซึ่งเข้าใจว่า AI ยังไม่เข้าใจตรงนี้

แต่ที่ประทับใจคือ มันพบแทคติคต่างๆด้วยตนเอง ไล่ตามฮีโร่ที่เจ็บ, ตีเป็นตัวสุดท้ายจะได้เครดิตมากกว่า, ไม่เด๋อเข้าลุยเดี่ยวๆ รู้จักหลบหลัง creep, ฯลฯ แต่ถ้าเป็นแบบนี้ อีกไม่กี่ปีคงได้เจอ AI รุ่นที่สามารถสู้กับผู้เล่นแนวหน้าในเกมปกติได้

แต่ส่วนตัวคิดว่า ต่อให้เป็นเกมแบบปกติ DOTA2 ยังซับซ้อนน้อยกว่า SC2 รายนั้นไหนจะมีเรื่องการบริหารทรัพยากร, ขยายฐาน, ไต่ tech-tree, ในช่วงนี้จะผลิต unit ไหนดี (rock-paper-scissors), การแพ้ทางระหว่างเผ่า, หรือจะกลยุทธ์ลักไก่ (cheese)

ป.ล. AI ที่แข่งเค้าล็อค APM ให้อยู่ระดับผู้เล่นที่เป็นมนุษย์ครับ

By: H0RNET
AndroidWindows
on 12 August 2017 - 19:58 #1002296 Reply to:1002278

เขียนได้ดีครับ +1

By: fantast
Windows Phone
on 12 August 2017 - 21:07 #1002298 Reply to:1002278
fantast's picture

คือผมไม่แน่ใจว่าแทคติค (พฤติกรรมบอท) ที่ว่าหนิเขากำหนดให้มันเรียนรู้ หรือมันเรียนรู้เอง

ซึ่งถ้าทีมพัฒนากำหนดให้ป็นพฤติกรรมที่ต้องเรียนรู้ ผมว่าธรรมดามากครับที่บอทจะชนะ

แต่ถ้าเขากำหนดแค่เรื่องพื้นฐานของเกมส์แบบไม่กำหนดพฤติกรรม แต่บอทดันเรียนรู้พฤติกรรมเหล่านี้เองได้เอง
- Creep Aggro
- Creep Blocking
- Zoning
- Raze Dodgin
- Raze Faking
ผมว่าน่าเหลือเชื่อมากครับ

ตอนนี้อยากเห็นเปเปอร์หรือโค้ดอธิบายครับ

By: fantast
Windows Phone
on 12 August 2017 - 21:11 #1002301 Reply to:1002298
fantast's picture

เอาตรงๆ ผมเองยังไม่อยากเชื่อนะครับว่ามันจะเรียนรู้เรื่องเหล่านี้ได้เองโดยไม่กำหนด

ผมเดาว่าต้องมีโปรฯหรือคนที่เข้าใจเกมส์กำหนดพฤติกรรมเหล่านี้เป็นเป้าหมายให้บอทเรียนรู้ครับ

คือถ้าไม่กำหนดเป้าหมายแต่มันเข้าใจเรื่องนี้ได้เองนี่ เตรียมเข้าสู่ยุคของ AI ครองเมืองได้เลยครับผม :)

By: thanyadol
iPhone
on 12 August 2017 - 21:34 #1002304 Reply to:1002298

เขาบอกว่ามีการ โคชครับ

By: thanyadol
iPhone
on 12 August 2017 - 21:34 #1002303 Reply to:1002278

กติกาเหมือนเกมส์ 1-1 ทั่วไปครับ no rune, no shrine, no bottle, no soul ring

สามารถกดดูไอเทมและสกิลได้ปกติครับ ช่วงแรกๆ ของคลิบ

By: mk-
Symbian
on 12 August 2017 - 23:32 #1002314 Reply to:1002278
mk-'s picture

แข่ง 1-1 นี่ครับ ไม่มีการซื้ออาวุธ อัพสกิล ค่อนข้างง่ายเลยสำหรับบอท แทบจะเป็น perfect information

By: flittleconan
AndroidUbuntuWindows
on 13 August 2017 - 04:21 #1002326

สรุปว่าโดน abuse ไปซะแล้ว https://www.reddit.com/r/DotA2/comments/6t8qvs/openai_bots_were_defeated_atleast_50_times/

By: Jirawat
Android
on 13 August 2017 - 10:02 #1002343
Jirawat's picture

 ขอศึกษาแปป จะเอาไปปั๊ม MMR ของตัวเองตอนนี้ ลดฮวบๆ

By: z2
Windows PhoneAndroidUbuntuWindows
on 13 August 2017 - 23:43 #1002410

ลองบลอคครีพ แบบ ai แล้ว มันระดับกด ไม่พลาด 0.001 เลยนะ ถึงจะทำได้แบบนั้น dendi ทำได้สุดยอดแล้วเกมส์แรก