Tencent เปิดตัวโมเดลปัญญาประดิษฐ์แบบคิดเป็นเหตุผล Hunyuan T1 โดยใช้การพัฒนาโมเดลแบบ Leverages Large-scale Reinforcement Learning เหมือนกับที่ DeepSeek ใช้ในการพัฒนาโมเดล R1 และวางสถาปัตยกรรมโมเดลแบบไฮบริด ใช้ Transformer ของกูเกิลร่วมกับ Mamba ของ Carnegie Mellon University ทำให้ลดต้นทุนการฝึกฝนและรันโมเดลได้มาก
ผลทดสอบโมเดล T1 พบว่าทำคะแนน MMLU ได้ 87.2 สูงกว่า R1 ของ DeepSeek ซึ่งอยู่ที่ 84 แต่ยังน้อยกว่า o1 ของ OpenAI ขณะที่ผลทดสอบอื่นออกมาสูสีกับ R1 อย่างไรก็ตาม Tencent บอกว่าต้นทุนการใช้งาน T1 นั้นถูกกว่า R1 โดยคิดราคา 1 หยวนต่อ 1 ล้านโทเค็นอินพุท และเอาท์พุท 4 หยวนต่อ 1 ล้านโทเค็น ส่วน R1 คิดราคาตามช่วงเวลา โดยกลางวันคิดอินพุท 1 หยวน ส่วนเอาท์พุท 16 หยวน แต่กลางคืนจะถูกลงเป็น 0.25 หยวนกับ 4 หยวน
Hunyuan T1 เผยแพร่แล้วผ่าน Huggingface และ Github สามารถทดลองใช้งานผ่านแชทบอต Hunyuan ได้เช่นกัน
ที่มา: Tencent ผ่าน South China Morning Post