Foxconn เปิดตัวโมเดล LLM ภาษาจีน FoxBrain ใช้เวลาเทรน 4 สัปดาห์ด้วย NVIDIA H100 จำนวน 120 ตัว

By: arjin

on 10 March 2025 - 19:00 Tags:

Topics:

Foxconn

LLM

Artificial Intelligence

Chinese

Foxconn เปิดตัวโมเดลปัญญาประดิษฐ์ภาษาขนาดใหญ่หรือ Large Language Model (LLM) เรียกชื่อว่า FoxBrain ซึ่งเดิมออกแบบพัฒนาเพื่อใช้งานภายในบริษัท โมเดล FoxBrain นี้มีความสามารถทั้งการวิเคราะห์ข้อมูล คณิตศาสตร์ การให้เหตุผล แก้ไขปัญหา และการเขียนโค้ด โดยโมเดลนี้ทำงานเป็นภาษาจีนมาตรฐาน

FoxBrain พัฒนาโดย Hon Hai Research Institute หน่วยงานวิจัยและพัฒนาในเครือ Foxconn ซึ่งฝึกฝนด้วยจีพียู NVIDIA H100 จำนวน 120 ตัว ใช้เวลาเพียง 4 สัปดาห์เท่านั้น ซึ่ง Foxconn บอกว่าเป็นระยะเวลาที่สั้น ใช้ต้นทุนฝึกฝนที่ต่ำ

โมเดลนี้พัฒนาบนพื้นฐาน Llama 3.1 ของ Meta จำนวนพารามิเตอร์ 70B ผลทดสอบบนภาษาจีนทำคะแนนได้ดีกว่าโมเดลคล้ายกันอย่าง Llama-3-Taiwan-70B โดยเฉพาะด้านคณิตศาสตร์ อย่างไรก็ตาม Foxconn บอกว่าความสามารถยังน้อยกว่า DeepSeek ที่เป็นผู้นำในตอนนี้ แต่ภาพรวมยังทำคะแนนได้ดีในระดับโมเดลชั้นนำของโลก

Foxconn มีแผนนำโมเดล FoxBrain นี้ เผยแพร่ผ่านพาร์ตเนอร์ในช่องทางต่าง ๆ และโอเพนซอร์ส เพื่อส่งเสริมการใช้งาน AI สำหรับภาคการผลิตและซัพพลายเชนต่อไป

ที่มา: Hon Hai ผ่าน The Wall Street Journal