Tencent เปิดตัว Hunyuan T1 โมเดลคิดเป็นเหตุผล ระบุดีกว่า R1 ของ DeepSeek ทั้งผลทดสอบและต้นทุน

By: arjin

on 23 March 2025 - 09:41 Tags:

Topics:

Tencent

Artificial Intelligence

Tencent เปิดตัวโมเดลปัญญาประดิษฐ์แบบคิดเป็นเหตุผล Hunyuan T1 โดยใช้การพัฒนาโมเดลแบบ Leverages Large-scale Reinforcement Learning เหมือนกับที่ DeepSeek ใช้ในการพัฒนาโมเดล R1 และวางสถาปัตยกรรมโมเดลแบบไฮบริด ใช้ Transformer ของกูเกิลร่วมกับ Mamba ของ Carnegie Mellon University ทำให้ลดต้นทุนการฝึกฝนและรันโมเดลได้มาก

ผลทดสอบโมเดล T1 พบว่าทำคะแนน MMLU ได้ 87.2 สูงกว่า R1 ของ DeepSeek ซึ่งอยู่ที่ 84 แต่ยังน้อยกว่า o1 ของ OpenAI ขณะที่ผลทดสอบอื่นออกมาสูสีกับ R1 อย่างไรก็ตาม Tencent บอกว่าต้นทุนการใช้งาน T1 นั้นถูกกว่า R1 โดยคิดราคา 1 หยวนต่อ 1 ล้านโทเค็นอินพุท และเอาท์พุท 4 หยวนต่อ 1 ล้านโทเค็น ส่วน R1 คิดราคาตามช่วงเวลา โดยกลางวันคิดอินพุท 1 หยวน ส่วนเอาท์พุท 16 หยวน แต่กลางคืนจะถูกลงเป็น 0.25 หยวนกับ 4 หยวน

Hunyuan T1 เผยแพร่แล้วผ่าน Huggingface และ Github สามารถทดลองใช้งานผ่านแชทบอต Hunyuan ได้เช่นกัน

ที่มา: Tencent ผ่าน South China Morning Post

No Description