Alibaba Cloud เปิดตัว QwQ-32B โมเดลคิดทบทวนก่อนตอบเพิ่มความแม่นยำใกล้ OpenAI o1 เข้าใจภาษาไทยแต่คิดเป็นภาษาจีน

By: lew

on 28 November 2024 - 12:32 Tags:

Topics:

Alibaba Cloud

LLM

Qwen

ทีม Qwen ของ Alibaba Cloud เปิดโตัวโมเดลปัญญาประดิษฐ์ QwQ (อ่านว่า ควิว/quil) เป็นโมเดลเพื่อการทดลองที่จะไม่มุ่งตอบคำถามทันที แต่พยายามคิดทบทวนก่อน ทำให้คำตอบที่ได้แม่นยำขึ้น

ความโดดเด่นของ QwQ-32B คือคะแนนทดสอบหลายชุดทดสอบ เช่น GPQA, AIME, MATH-500, หรือ LiveCodeBench นั้นสูงขึ้นมาก เทียบชั้นกับ OpenAI o1-preview เลยทีเดียว อย่างไรก็ดีทีมงานพบปัญหาการคิดของโมเดลมักสลับภาษาไปมา (ผมทดลองถามภาษาไทยก็คิดเป็นภาษาจีน) บางครั้งคิดวนไปวนมาไม่ได้คำตอบ นอกจากนี้ยังต้องเพิ่มความระมัดระวังความปลอดภัยในการใช้งาน และคะแนนทดสอบก็อาจจะมีข้อจำกัดไม่สามารถทดสอบความสามารถบางด้าน

ทีมงานปล่อยโมเดลนี้ในไลเซนส์แบบ Apache 2.0 ตัวโมเดลรองรับ context ขนาด 32,768 tokens แม้จะตอบค่อนข้างยาวจากการทบทวนความคิดไปมา แต่การสร้างคำตอบก็ค่อนข้างเร็ว

ผู้สนใจทดสอบได้บน HuggingFace หรือใช้งานผ่าน API บน Together.AI ก็ได้เช่นกัน

ที่มา - QwenLM

No Description