Foxconn เปิดตัวโมเดลปัญญาประดิษฐ์ภาษาขนาดใหญ่หรือ Large Language Model (LLM) เรียกชื่อว่า FoxBrain ซึ่งเดิมออกแบบพัฒนาเพื่อใช้งานภายในบริษัท โมเดล FoxBrain นี้มีความสามารถทั้งการวิเคราะห์ข้อมูล คณิตศาสตร์ การให้เหตุผล แก้ไขปัญหา และการเขียนโค้ด โดยโมเดลนี้ทำงานเป็นภาษาจีนมาตรฐาน
FoxBrain พัฒนาโดย Hon Hai Research Institute หน่วยงานวิจัยและพัฒนาในเครือ Foxconn ซึ่งฝึกฝนด้วยจีพียู NVIDIA H100 จำนวน 120 ตัว ใช้เวลาเพียง 4 สัปดาห์เท่านั้น ซึ่ง Foxconn บอกว่าเป็นระยะเวลาที่สั้น ใช้ต้นทุนฝึกฝนที่ต่ำ
โมเดลนี้พัฒนาบนพื้นฐาน Llama 3.1 ของ Meta จำนวนพารามิเตอร์ 70B ผลทดสอบบนภาษาจีนทำคะแนนได้ดีกว่าโมเดลคล้ายกันอย่าง Llama-3-Taiwan-70B
โดยเฉพาะด้านคณิตศาสตร์ อย่างไรก็ตาม Foxconn บอกว่าความสามารถยังน้อยกว่า DeepSeek ที่เป็นผู้นำในตอนนี้ แต่ภาพรวมยังทำคะแนนได้ดีในระดับโมเดลชั้นนำของโลก
Foxconn มีแผนนำโมเดล FoxBrain นี้ เผยแพร่ผ่านพาร์ตเนอร์ในช่องทางต่าง ๆ และโอเพนซอร์ส เพื่อส่งเสริมการใช้งาน AI สำหรับภาคการผลิตและซัพพลายเชนต่อไป
ที่มา: Hon Hai ผ่าน The Wall Street Journal