DeepMind แถลงความสำเร็จในการสร้างโมเดลปัญญาประดิษฐ์สำหรับแข่งคณิตศาสตร์ โดยอาศัยโมเดลสองตัว ได้แก่ AlphaProof โมเดลสำหรับการให้เหตุผลทางคณิตศาสตร์ และ AlphaGeometry 2 โมเดลแก้โจทย์เรขาคณิตที่ DeepMind รายงานประสิทธิภาพมาก่อนหน้านี้ โดยรวมสามารถแก้ปัญหาได้ 4 ข้อจาก 6 ข้อ รวมได้ 28 คะแนน หากเป็นผู้เข้าแข่งปกติก็จะได้เหรียญเงิน
AlphaProof ไม่ได้อ่านภาษาอังกฤษปกติ แต่ต้องอ่านภาษา Lean เพื่อการพิสูจน์ทฤษฎีคณิตศาสตร์ ทาง DeepMind อาศัย Gemini แปลภาษาโจทย์ให้กลายเป็นภาษา Lean เพื่อให้ AlphaProof พิสูจน์ทฤษฎีบท กระบวนการฝึก AlphaProof นั้นไม่ได้เรียนรู้จากบทพิสูจน์ที่มีอยู่เดิม แต่อาศัยการฝึกแบบ reinforce learning ด้วยการสร้างทฤษฎีแล้วให้ AlphaProof พยายามพิสูจน์ว่าถูกหรือผิดไปเรื่อยๆ จนพบหนทาง แกนกลางภายในของ AlphaProof นั้นคือ AlphaZero ที่เคยใช้ฝึกการเล่น Go มาก่อนแล้ว
ขณะที่ AlphaGeometry 2 ถูกปรับปรุงจากรุ่นแรกที่รายงานออกมาเมื่อต้นปีที่ผ่านมา ก่อนการแข่งขันสามารถแก้โจทย์คณิตศาสตร์โอลิมปิกย้อนหลัง 25 ปีได้ 83%
การแข่งขันครั้งนี้โมเดลทั้งสองตัวยังคงต้องอาศัยคนช่วยแปลโจทย์ให้เป็น formal language เสียก่อน และมีโจทย์ข้อหนึ่งที่ปัญญาประดิษฐ์ใช้เวลาแก้ถึงสามวัน ขณะที่การแข่งจริงให้เวลารวม 9 ชั่วโมงเท่านั้น
ที่งานวางแผนพัฒนาปัญญาประดิษฐ์ที่พัฒนาต่อจาก Gemini ให้สามารถรับโจทย์ได้เหมือนกับที่ผู้เข้าแข่งคนอื่นๆ อ่านได้โดยตรง ทาง DeepMind ไม่ได้รายงานว่าได้คะแนนมากน้อยแค่ไหน แต่ระบุว่าผลที่ได้ดูมีความหวัง
ที่มา - DeepMind
Comments
แต่อาศัยการฝึกแบบ
ที่หัวข่าว คณิตาสตร์ -> คติศณาตรส์
ไม่รู้ว่าถ้าได้ทำโจทย์ลักษณะเดียวกันซ้ำ ๆ แต่เปลี่ยนตัวแปรไปเรื่อย ๆ จะสามารถสร้าง model ได้หรือเปล่า
แสดงว่าไม่มั่นใจใน LLM ตั้งแต่แรกเลยเลือกเทรนด้วยภาษาเฉพาะของโมเดลไปเลย