Tags:
Node Thumbnail

Alibaba Cloud เปิดตัวโมเดลปัญญาประดิษฐ์ LLM ในชื่อ QwQ-32B (อ่านว่า ควิว) โมเดลคิดก่อนตอบ ที่เคยเปิดรุ่นพรีวิวไปก่อนหน้านี้เมื่อปลายปี 2024 แต่ตอนนี้ออกเป็นตัวจริง โดยผลที่ได้มีคะแนนทดสอบหลายชุดดีขึ้นอย่างชัดเจน จนขึ้นมาใกล้เคียงกับ DeepSeek-R1 ที่มีขนาดใหญ่กว่า 20 เท่า

ทีมงานฝึก QwQ โดยเริ่มจากปัญหาคณิตศาสตร์และการเขียนโปรแกรมก่อน เพราะปัญหาทั้งสองหมวดหมู่นี้ตรวจสอบคำตอบได้ง่าย ทำให้สามารถฝึกแบบ reinforcement learning (RL) ได้โดยดูคำตอบเป็นหลัก จากนั้นนั้นฝึกเพิ่มเพื่อขยายความสามารถด้านอื่นๆ เช่น การเลือกใช้เครื่องมือ โดยทีมงานพบว่าการฝึกช่วงหลังนี้ไม่ต้องมากนักก็เพิ่มความสามารถได้้ โดยที่ความสามารถหลักด้านการเขียนโปรแกรมก็ไม่ได้แย่ลงนัก

DeepSeek เองก็เคยปล่อยโมเดล R1 รุ่นทึ่ฝึกต่อจาก Qwen-32B เช่นกัน แต่ผลทดสอบแย่กว่า QwQ-32B มาก ทำให้ตอนนี้เราสามารถใช้งานโมเดลระดับใกล้เคียง DeepSeek-R1 หรือ o1-preview ได้ในคอมพิวเตอร์ขนาดไม่ใหญ่นัก แถมตัวโมเดลเปิดให้ใช้งานอย่างเสรี

หุ้น Alibaba ขึ้นไปถึง 8% นับแต่เปิดตัว QwQ-32B

ที่มา - QwenLM

No Description

Get latest news from Blognone

Comments

By: astider
AndroidWindows
on 7 March 2025 - 00:31 #1335305

รอคนทำโมเดลชื่อ UwU

By: Peterfish on 7 March 2025 - 08:36 #1335315

ไปลองรันดู คิดนานมากครับ (เครื่องช้า) คิดไปคิดมา โทเคนหมดตั้งค่าน้อยไป ยังคิดไม่เสร็จเลย

By: lew
FounderJusci's WriterMEconomicsAndroid
on 7 March 2025 - 09:18 #1335324 Reply to:1335315
lew's picture

โมเดลเล็ก + ฉลาด ไม่ได้แปลว่าค่ารันถูก :P


lewcpe.com, @wasonliw