Alibaba เผยแพร่ Qwen2.5-Max โมเดล AI MoE ขนาดใหญ่ ผลทดสอบคะแนนสูงกว่า DeepSeek V3

By: arjin

on 29 January 2025 - 18:06 Tags:

Topics:

Alibaba Cloud

Artificial Intelligence

LLM

Qwen

Alibaba เผยแพร่โมเดลปัญญาประดิษฐ์ Qwen2.5-Max ซึ่งเป็นโมเดลภาษาขนาดใหญ่แบบ MoE (Mixture-of-Expert) เหมือนกับ DeepSeek V3 ถูก Pre-train มากกว่า 20 ล้านล้านโทเค็น และทำ Post-Train ด้วยวิธี SFT (Supervised Fine-Tuning) และ RLHF (Reinforcement Learning from Human Feedback)

ผลทดสอบความสามารถของ Qwen2.5-Max ได้คะแนนเหนือกว่า DeepSeek-V3, GPT-4o และ Claude-3.5-Sonnet ในหัวข้อเช่น Arena-Hard, LiveBench ส่วนหัวข้ออย่าง MMLU-Pro กับ LiveCodeBench คะแนนสูงกว่า DeepSeek-V3 แต่น้อยกว่า Claude-3.5-Sonnet

Qwen2.5-Max เปิดให้ใช้งานแล้ววันนี้ผ่าน API ของ Alibaba Cloud และผ่านบริการ Qwen Chat

ที่มา: Alibaba

No Description