Tags:
Node Thumbnail

ทีม Qwen ของ Alibaba Cloud เปิดโตัวโมเดลปัญญาประดิษฐ์ QwQ (อ่านว่า ควิว/quil) เป็นโมเดลเพื่อการทดลองที่จะไม่มุ่งตอบคำถามทันที แต่พยายามคิดทบทวนก่อน ทำให้คำตอบที่ได้แม่นยำขึ้น

ความโดดเด่นของ QwQ-32B คือคะแนนทดสอบหลายชุดทดสอบ เช่น GPQA, AIME, MATH-500, หรือ LiveCodeBench นั้นสูงขึ้นมาก เทียบชั้นกับ OpenAI o1-preview เลยทีเดียว อย่างไรก็ดีทีมงานพบปัญหาการคิดของโมเดลมักสลับภาษาไปมา (ผมทดลองถามภาษาไทยก็คิดเป็นภาษาจีน) บางครั้งคิดวนไปวนมาไม่ได้คำตอบ นอกจากนี้ยังต้องเพิ่มความระมัดระวังความปลอดภัยในการใช้งาน และคะแนนทดสอบก็อาจจะมีข้อจำกัดไม่สามารถทดสอบความสามารถบางด้าน

ทีมงานปล่อยโมเดลนี้ในไลเซนส์แบบ Apache 2.0 ตัวโมเดลรองรับ context ขนาด 32,768 tokens แม้จะตอบค่อนข้างยาวจากการทบทวนความคิดไปมา แต่การสร้างคำตอบก็ค่อนข้างเร็ว

ผู้สนใจทดสอบได้บน HuggingFace หรือใช้งานผ่าน API บน Together.AI ก็ได้เช่นกัน

ที่มา - QwenLM

No Description

No Description

Get latest news from Blognone

Comments

By: Azymik on 28 November 2024 - 13:07 #1327996

เปิดโตัว

เปิดตัว

By: Golflaw
ContributoriPhoneAndroidWindows
on 29 November 2024 - 16:35 #1328096
Golflaw's picture

เคยทดลองใช้ chatgpt วางแผนเที่ยว
ถามภาษาไทย เที่ยวในไทย ชื่อสถานที่ที่ขอเป็นภาษาไทย
แต่ตอบเป็นภาษาอังกฤษ
ยังดีสั่งให้แปลกลับมาเป็นภาษาไทยได้


A smooth sea never made a skillful sailor.