เดินทางมาถึงกระดานที่ 4 สำหรับการแข่งขันหมากล้อมระหว่าง AlphaGo และ Lee Sedol โดยผลการแข่งขันวันนี้ Lee Sedol เอาชนะ AlphaGo ไปได้อย่างสวยงาม
Lee ใช้เวลา 2 ชั่วโมงจนหมด ในขณะที่ตอนนั้น AlphaGo ยังเหลือเวลาอยู่ถึง 1 ชั่วโมงกว่าๆ ทั้งคู่แข่งกันไปมาจนฝั่ง AlphaGo เหลือเวลา 54 วินาที ก่อนจะยอมแพ้ในที่สุด
ด้าน Demis Hassabis ผู้ก่อตั้ง DeepMind ทวีตว่า AlphaGo เดินพลาดตอนตาที่ 79 แต่เพิ่งจะรู้ตัวตอนตาที่ 87 ทำให้ความมั่นใจว่าจะชนะของ AlphaGo ดิ่งลงจาก 70% เหลือต่ำมาก (แต่ไม่ได้บอกว่าเท่าไหร่)
จังหวะที่ AlphaGo ยอมแพ้ บนหน้าจอคอมพิวเตอร์ขึ้นว่า "AlphaGo resigns: The result "W+Resign" was added to the game information"
ที่มา - YouTube: DeepMind
Lee Sedol is playing brilliantly! #AlphaGo thought it was doing well, but got confused on move 87. We are in trouble now...
— Demis Hassabis (@demishassabis) March 13, 2016
Mistake was on move 79, but #AlphaGo only came to that realisation on around move 87
— Demis Hassabis (@demishassabis) March 13, 2016
When I say 'thought' and 'realisation' I just mean the output of #AlphaGo value net. It was around 70% at move 79 and then dived on move 87
— Demis Hassabis (@demishassabis) March 13, 2016
Lee Sedol wins game 4!!! Congratulations! He was too good for us today and pressured #AlphaGo into a mistake that it couldn’t recover from
— Demis Hassabis (@demishassabis) March 13, 2016
Comments
AlphaGo วันนี้จงใจวางหมากฆ่าตัวตาย 2-3 หมากเลย
ปล. หน้าต่างนั่นใช่ Ubuntu รึเปล่า
ใช่ครับ Ubuntu
Coder | Designer | Thinker | Blogger
พี่ลีแกสุดยอดมากกกกกกกกก
ยินดีด้วยกับลีเซดอล
That is the way things are.
มันได้รู้จักมนุษย์มากขึ้นแล้ว กระดานสุดท้าย นี่น่าชมมาก
ถ้าลีเล่นแบบเดิมในวันอังคารแล้ว คอมยังแพ้ อยู่ ก็จบเลยดิ หวังว่าวันอังคารคอมจะแก้เป็นนะ ไม่งั้นจบเลยนะ
มีบันทึกหมากรึยังครับ
https://online-go.com/demo/116862
แม้เวลาปกติ 2 ชม ของเขาหมดไปนานแล้ว ต้องเดินจำกัดเวลา 1 นาทีในแต่ละหมาก จนชนะได้ แกก็สมกับระดับ 9 ดั้งจริงๆ
ยินดีด้วย
จะไม่มีการแก้ไขตัวโปรแกรมใดๆระหว่างแข่งทั้งสิ้นครับ คือ freeze เอาไว้เลย และส่วนตัวคิดว่า DeepMind ไม่พัฒนามากไปกว่านี้เพราะแมทช์โดยรวมนี้ก็ชนะไปแล้ว และยังมีเกมอื่นอีกเยอะรอเข้าคิวอยู่ (ล่าสุดโปรเฟสชั่นเนลเกมเมอร์ StarCraft สองคน flash กับ boxer ออกมาพูดท้าทาย DeepMind แล้วครับว่าเอาชนะเค้าไม่ได้หรอก)
ต้องรีบท้ารีบแข่ง ปล่อยไว้นานเดี๋ยว AlphaGo มันเก่ง 555
เหมือน AlphaGo รับมือพลาด ไม่เคยเจอกลยุทธแบบนี้
พลาดทำกลางกระดานหายทั้งแถบ เลยเป๋หนักเลย
ยินดีด้วย อย่างน้อยก็กู้หน้ามาได้สวยงามสมเป็น Lee Sedol จริงๆ กำลังสงสัยว่าถ้า ช่วงหลัง alphago ลงตามที่คนปกติเดิน คงชนะแหละ แต่ยังไงก็สุดยอดสมเป็นแชมป์โลกจริงๆ
ตาลีคิดนานช่วงเกมแรกๆเพราะแกเคยบอกว่าแกเล่นไม่เก่งตอนเปิดเกม เลยขอคิดนานหน่อย พอเกมมากลางเกมถึงปลายเกม หมากลงไปเยอะ ก็เริ่มใช้เวลาคิดไม่ต้องนานมากแล้ว
โลกต้องการคนอย่าง Lee Conner
อีก 20ปี ให้หลัง DeepMind ส่งหุ่นยนต์ย้อนเวลามากำจัดลี
หะ! GoMinator
Plot ของ Terminator กับ All you need is kill ลอยขึ้นมาเลย ว่าแต่ใครเป็นคนย้อนบ้างเนี่ย
ขอแสดงความยินดีด้วยกับคุณ Lee Sedol ครับ
ปล.
หลังจบเกมทาง AlphaGo ได้ตัดพ้อกับทางผู้สร้าง
ว่ารู้สึกกดดันจากการที่ถูกมนุษย์ส่วนหนึ่งขู่ฆ่า...อันนำมาสู่การแกล้งแพ้ในหมากตานี้และตาหน้า
เป็นไปไม่ได้ครับที่ให้สัมภาษณ์ว่า “อันนำมาสู่การแกล้งแพ้ในหมากตานี้และตาหน้า”
เพราะถ้าประกาศว่าแกล้งแพ้คือการไม่ให้เกียรติคู่แข่งครับ
อีกอย่างหมากตาที่78ของลีต่างหากที่เป็นหมากสุดยอดพลิกเกม ลองฟังคนสัมภาษณ์คนสุดท้ายหลังเกมครับนักข่าวจากจีนบอกว่า กู่ลี่(โปร 9ดั้งของจีน)ยังชมเลยว่าเป็น 'It's a God play'
ว้าวสุดยอดเป็นไปได้ยังไงเนี่ย ส่วนตัวแปลกใจมาก คนชนะหุ่นยนต์ที่เรียนรู้มากกว่ามนุษย์ได้ แถมหุ่นยนต์เดินพลาดคืออะไร? ตา5ลีน่าจะทำได้ดีกว่านี้นะ
ยินดีด้วยครับ แกวางหมากได้ใจเย็นมาก จนเวลาของคอมเหลือนิดเดียวแล้วก็ขอยอมแพ้ไปเลย
แต่ตาหลังๆผมก็เห็นด้วยกับข้างบนนะว่าเริ่มเดินแปลกๆแล้ว
แรมเต็มหรือเปล่า เลยแพ้
Alpha คงเจอรูปแบบหมากที่ยังไม่เคยเรียนรู้ กระดานต่อไปคงไม่พลาดกับการแก้เกมแบบนี้แล้ว
ท่าไม้ตายใช้กับเซนต์ซ้ำสองไม่ได้หรอกนะ
AlphaGoไม่ได้กล่าวไว้
AlphaGo ที่ใช้แข่งรอบนี้เป็นเวอร์ชั่นที่ freeze ไว้ครับ จนกว่าจะจบ 5 กระดาน หมายความว่ากระดานที่ 5 ก็ยังเป็น AlphaGo ตัวเดียวกับที่แข่งกระดานแรก
ถ้าโดน Freeze ไว้ถ้างั้นผมว่าก็ค่อนข้างเสียเปรียบคนนะครับ ลีเล่นจบเกมแพ้แล้วยังสามารถกลับไปทบทวนและวางกลยุทธ์พัฒนาฝีใหม่ใหม่ที่ AlphaGo ใช้ได้ แต่ AlphaGo จะไม่ได้ทำการวิเคราะห์วิธีเล่นของคู่ต่อสู้เพื่ม ราวกับว่าเพิ่งเคยเจอกันเป็นครั้งแรก
ขนาดว่าเสียเปรียบ Lee Sedol ยังแพ้สามกระดานรวดเลยครับ lol
อย่าเพิ่งลืมจุดประสงค์ของ AlphaGo ด้วยสิครับ นั่นคือเก็บข้อมูลจากการเล่นครั้งนี้เพื่อเอาไปพัฒนาอัลกอริทึ่มต่อ
ถ้าไปดูวิธีที่สร้าง AlphaGo ขึ้นมาจะเห็นภาพ คร่าวๆที่ผมนึกออกคือ Engineer กำหนดอัลกิริทึมอะไรต่างๆให้จนเสร็จ จากนั้นให้มันไปพัฒนาตัวเอง ด้วยการเอาข้อมูลมหาศาลยัดเข้าไป ป้อนข้อมูลเสร็จจับมันเล่นกับตัวเองไปเรื่อยๆอีก
ทีนี้นึกภาพถ้า Engineer ต้องการเห็นว่า AlphaGo พัฒนาไปถึงไหนแค่ไหน ก็ต้องหยุดไว้ซักจุดเพื่อใช้อ้างอิงทางวิทยศาสตร์ได้ หาก AlphaGo พัฒนาตัวเองไปด้วยขณะที่แข่ง 5 รอบ ผมว่า engineer ที่นั่ง debug.. เอ๊ย ผมหมายถึงนั่น monitor อยู่คงไม่รู้จะเอาอะไรเป็นเกณฑ์ คงหาผลลัพท์ไม่ได้เลยว่าอัลกอริทึ่มที่คิดไว้มันใช้ได้จริงไหม (ไม่สิ มันก็ใช้ได้แหละ แต่ใช้ได้ผลแค่ไหนต่างหาก)
และผมเสริม fact ให้อีกว่า จากข้อมูลคุณ Demis Hassabis ให้สัมพาษณ์ท้าย match 4 ว่า AlphaGo ต้องศึกษาหมากเป็นล้านๆกระดานเลย ถึงจะเพียงพอต่อ AlphaGo ในการปรับเปลื่ยนวิธีเล่น จำนวนแค่ไม่กี่พันกระดานไม่ส่งผลอะไร หรือพูดอีกนัยคือค่อพันกระดานยังไม่พอ
อ้างอิงจาก https://youtu.be/yCALyQRN3hw?t=6h9m34s นาทีที่ 6:9:34 - 6:11:18 (และใช่ครับ ในคำให้สัมพาษณ์เราได้รู้ว่า AlphaGo ไม่ได้ศึกษาหมากของ Lee Sedol มาก่อนเลย ข้อมูลที่ AG ใช้ฝึกกับตัวเองทั้งหมดมาจาก strong amateur player บน IGS)
วันนี้ทีมงานให้สัมภาษณ์ครับว่าโมเดลที่ได้มาจากข้อมูลจำนวนเยอะมาก ข้อมูลไม่กี่เกมก็ไม่น่าเปลี่ยนอะไรได้อยู่ดี
lewcpe.com, @wasonliw
แบบนี้กระดาน 5 ก็ไม่มีความหมายแล้วซิ
Lee คงรู้วิธีเล่นแล้ว ว่าแบบไหนที่จะทำให้ชนะ AlphaGo ได้ (จุดอ่อน ก็ยังเป็นจุดอ่อนอยู่)
สงสัยว่าการโปรแกรม AI ควรจะสู้จนหมากสุดท้ายหรือเปล่า มันยอมแพ้เป็นด้วยหรอ
alphago คำนวณ ความเป็นไปได้ที่จะชนะ ได้ครับ
หมายความว่าถ้ามันลงต่ำสุดกู่ ก็ยอมแพ้ได้เหมือนกัน
ถ้าคำนวณไม่ได้จะมีปัญหาเรื่องตอน self training ที่แข่งกับตัวเองครับ
เห็นมีคนเคยบอกว่าเป็นมารยาทในการเล่นโกะครับ การเล่นต่อทั้งๆ ที่รู้ว่าแพ้มันเหมือนกับการไม่เคารพคู่ต่อสู้เท่าไหร่
ปล.ผมมั่วครับ รอท่านอื่นมายืนยัน
เคยอ่านแต่จากฮิคารุ ประมาณนั้นแหละครับ
คนที่รู้ตัวว่าถึงทางตันแล้วเล่นต่อก็พลิกเกมไม่ได้ ถึงจะยังเล่นไม่จบก็จะขอยอมแพ้เองไป
เข้าใจว่าวงการนี้มีวัฒนธรรมและจารีตเก่าแก่สืบทอดมาเยอะ โดยเฉพาะเรื่องมารยาท
ตัว AI มันประมาณการณ์ได้ฮะว่ามีโอกาสชนะกี่ %
ซึ่งตามในข่าว % มันต่ำมาก ซึ่งผู้สร้างอาจจะตั้งค่าไว้ก็ได้
ว่าต่ำกว่า 10% ให้ยอมแพ้อะไรแบบนี้
หรือไม่ถ้า Deepmind จริงคงประเมินสถานการณ์ได้เองว่าคงไม่ชนะแล้ว
ซึ่งการในการเล่นโกะปกติถ้ารู้ว่าตัวเองแพ้แน่ๆ ส่วนมากเค้าไม่เดินต่อกันจนจบเกมครับ ยอมแพ้กันไปเลย
ตาที่เล่นกันจนจบกระดานคือยังมองเห็นช่องที่บุกได้อีก หรือมองยากมากว่าอาจจะต่างกันแค่ 5 แต้มหรือแค่ครึ่งแต้ม อะไรแบบนั้น
According to David Silver, another researcher on the team that build AlphaGo, the machine will resign not when it has zero chance of winning, but when its chance of winning dips below 20 percent. “We feel that this is more respectful to the way humans play the game,”
ความพลิกแพลงของคนอาจมากกว่าก็ได้
สงสัย AlphaGo ยอมแพ้ทำไม
ทำไมไม่คิดว่ามนุษย์จะพลาดบ้าง
เพราะถ้ามนุษย์พลาด ก็มีโอกาสพลิกกลับมาชนะได้เหมือนกัน
เพราะการชนะของ Lee ในวันนี้ หุ่นยนต์จึงกลับไปพัฒนา...
และ Skynet จึงได้ถือกำเนิดขึ้น
มุกSkynetไม่เบื่อบ้างเหรอครับ
ก็ไม่นะครับ
ถ้าเปลี่ยนเป็น Sky High หรือ Sky Angel มันจะเมื่อยแขนะ
ถ้าเปลี่ยนเป็น Deus Ex Machina จะหายครับ
ผมแซวนะครับ XD
สงสัย สอบถามหน่อยครับ
3 match ก่อนหน้า ที่ Lee Sedol แพ้ เพราะแกเดินหมากพลาดรึเปล่าครับ เลยทำให้ต้องยอมแพ้ในตอนท้ายๆ
ปล.ผมเล่นโก๊ะไม่เป็น ไม่รู้ว่าเดินพลาดคือเดินให้เขากินใช่ไหม(อันนี้มโนเอาเอง)
รู้สึกกระดานที่สองหรือสาม Leeเดินจนไม่เหลือเวลาให้คิดแล้ว เก่งแค่ไหนโดนเวลาบีบก็ไปไม่เป็นเหมือนกัน
กระดานนี้ก็ไม่เหลือเวลานะครับ
ใช่ครับ แต่กระดานนี้AlphaGoใจไม่สู้ยอมแพ้เฉยเลย ต่อให้เดินพลาดก็เหอะ
ถ้าท่านจะมอง AG (AlphaGo) ให้มันต้องมีอารมณ์ใจสู้ ซึ่งเป็นข้อวินิฉัยผิดจุดเพราะ AG ไม่มีอารมณ์ใดๆตั้งแต่แรก ผมคงไม่มีข้อแย้งอะไรครับ
แต่หากอยากจะวิเคราะห์จริงๆว่าทำไม AG ท้ายเกมจึงเดินพลาดหรือทำไมจึงยอมแพ้ ผมชี้ว่าต้องไปดู AG ทำงานยังไง สาเหตุอะไรให้ทำให้ AG เลือกเดินหมากจุดนั้น
Lee Sedol ต้องยอมแพ้เพราะเดินหมากพลาดใช่ไหม?
ไม่ใช่ครับ
ที่ยอมแพ้เพราะ Lee Sedol ยอมรับว่าถึงจะเดินไปจนตาสุดท้าย ตัวเองก็ไม่สามารถมีแต้มนำอีกฝ่ายได้ จึงขอยอมแพ้
นอกจากประเด็นมารยาทของผู้เล่นที่สุภาพกว่าเมื่อยอมแพ้หากรู้ว่าสู้ไม่ได้ เหตุผลหลักจริงๆคือ ถึงจะดื้อดึงเดินจนหมดตาเดิน มันก็ไม่ชนะอยู่ดีอ่ะ ไม่รู้จะเดินต่อไปทำไมให้อายตัวเอง
(บางครั้งคนเล่นมีอารมณ์นำถึงจะรู้ว่าตัวเองแพ้ก็ไม่ยอมรับเดินต่อไปเรื่อยๆจนต้องให้อีกฝ่ายตอนจนมุมอับอายกันไปข้ามจนยอมก็มี น้อยครั้งจะเห็นอะไรแบบนั้นในการแข่งระดับมืออาชีพ อันนี้ยกตัวอย่างให้เห็นภาพเฉยๆ)
ปล. แต้มที่นับกันท้ายเกมคือการนับ 'พื้นที่' ที่แต่ล่ะฝ่ายครองอยู่ครับ การครองพื้นที่ใดๆคือ หมากฝ่ายนั้นต้องล้อมรอบพื้นที่ว่างๆที่เหลืออยู่ ใครมีพื้นที่ว่างมากสุดก็จะชนะ ดังนั้นการกินหมากแต่ละเม็ดไม่ใช่สิ่งจำเป็น มันเป็นแค่วิธีการนำไปสู่ผลลัพท์(ครองพื้นที่) ซึ่งกระดานโก๊ะ 19x19 มีจุดให้วางมากมาย จะวางจุดไหนก็ได้โดยไม่ขัดกติกา ดังนั้นที่ว่าพลาดไม่ใช่พลาดเพราะโดนกิน แต่พลาดปล่อยให้อีกฝั่งยึดพื้นที่ว่างไปครอบครองได้
นักเล่นโกะระดับ 1 ดั้ง(ธรรมดา) ก็สามารถจำตาที่ตัวเองเดินได้ทุกหมากในแต่ละกระดานแล้ว กว่าจะขึ้นระดับได้แต่ละดั้ง ทั้งโหด และก็ใช้เวลามาก
Lee Sedol ระดับ 9 ดั้ง โปร คนระดับนี้ไม่มีทางพลาดครับ เหมือนคนที่ปั่นจักรยานเป็น การเดินพลาดคือการแกล้งปั่นจักรยานไม่เป็นครับ มันเป็นไปไม่ได้
ส่วนในข่าวนี้ผมคิดว่าบอทก็ไม่ได้พลาดหรอกครับ เรียกว่าพลาดคงไม่ถูก แต่มันคงประเมินแล้วต้องเดินแบบนั้น
AlphaGo เหมือนจะดีไปหมดขาดอย่างเดียว ใจ ครับ ถ้าเป็นคนถึงจะรู้ว่าโอกาสชนะน้อยก็ยังสู้ แต่คอมยอมแพ้เลย
เป็นมารยาทครับ ถ้าสู้ยังไงก็ไม่ชนะคนเล่นโกะจะยอมรับว่าแพ้ แล้วเอาเวลากลับไปศึกษาว่าพลาดตรงใหน ซึ่งดีกว่าฝืนเล่นต่อไป
คนที่เขียนโปรแกรมก็เข้าใจนะ
AlphaGo resigns: The result "W+Resign" was added to the game information"
samsung ใหญ่แค่ใหน ?
https://youtu.be/6Afpey7Eldo
ถ้ารู้ตัวว่าจะแพ้ ตามมารยาทการเล่นโกะคือให้ยอมแพ้ครับ เพราะเสียเวลาอีกฝ่าย
3 กระดานแรกพี่ลีก็เป็นฝ่ายยอมแพ้นะครับ
คิดถึงเรื่อง Ender's game เลยครับ อีกหน่อยอาจจะต้องเทรนเด็กไปสู้กับคอมพ์
เป็นมารยาทของการเล่นโกะ ถ้าประเมินแล้วว่าแพ้แน่นอน (ซึ่งผู้เล่นสามารถคำนวณได้) ควรจะโยนหมากยอมแพ้ ลีที่แพ้สามตาก่อนหน้าก็เป็นฝ่ายยอมแพ้ทั้งนั้น และยอมแพ้ทั้งสามกระดาน
ใจสู้ไม่สู้ เขาวัดกันจนถึงจุดที่รู้ผลแพ้ชนะครับ (ไม่ว่าจะเดินจบกระดานหรือไม่ก็ตาม) ถ้าถึงจุดนี้แล้วยังดื้อเล่นต่อ นั่นคือดันทุรัง
นี่เป็นวิถีที่ "มนุษย์" เล่นเกมนี้ครับ
ผู้ใหญ่ลีพลิกกลับมาชนะได้รอบนี้ รู้สึกเป็นชัยชนะของมวลมนุษยชาติ =. .=
เห็นมีคนแชร์หมากดำเรียงกันเป็นคำว่า
"DIE HUMAN"
อันนั้นภาพปลอมครับ
กำ ขอบคุณครับที่แจ้ง
ความรู้สึกเหมือนหนังจบตอนท้ายที่มนุษย์เอาชนะหุ่นยนต์ได้ ฮา
ดูเหมือนมัน จะพลาด ตกบันได นะ
เกมส์ที่ 2 ก็ทีนึงละ
มาเกมนี้ก็พลาด เรื่องบันได อีก
กระดานสุดท้ายท่าจะมัน
ผม Skype ไปขู่มันเองครับ
บอกว่า อัลฟ่าถ้าเธอชนะอีกรอบ เราจะแกล้งเดินไปเตะปลั๊ก
เอาให้ Hard disk เธอเจ๊งกะบ๊งไปเลย
ได้ผลฮะ กลางกระดาน เดินพลาดเลย เย๊ๆ
ว้าว ยินดีกับ Lee ด้วย นายแน่มาก
..: เรื่อยไป
ชนะ 1 กระดานก็เหมือน สอน ต่ออีกสักกระดานไหม เห็นกันอยู่