ทีมวิจัย Qwen ของ Alibaba Cloud เปิดตัวโมเดล LLM ในชื่อ Qwen2 มี 5 ขนาดให้เลือกตั้งแต่ 0.5B, 1.5B, 7B, 14B, และ 72B โดยชูจุดเด่นรองรับภาษาอื่นๆ นอกจากภาษาอังกฤษ เช่นแถบเอเชียตะวันออกเฉียงใต้นั้นรองรับทั้ง ไทย, เวียดนาม, อินโดนีเซีย, เมียนมาร์, ลาว, กัมพูชา และยังรองรับ context window ถึง 128K
ผลทดสอบยอดนิยมเช่น MMLU หรือ HumanEval นั้น Qwen2-72B ทำได้เหนือกว่า Llama3-70B ไปเล็กน้อย ขณะที่ Qwen2-7B ก็เอาชนะ Llama3-7B ได้หลายชุดทดสอบโดยเฉพาะชุดทดสอบ HumanEval ที่คะแนนนำค่อนข้างมาก
Qwen2 ปล่อยให้ใช้งานแบบ Apache 2.0 ยกเว้นเฉพาะ Qwen2-72B เท่านั้นที่ยังจำกัดการใช้งานแบบ Qianwen License ทำให้โมเดลขนาด 7B สามารถใช้งานได้แทบไม่มีข้อจำกัด
สามารถทดลองใช้งานได้ใน HuggingFace ทั้งรุ่น 7B, และรุ่น 72B
ที่มา - QwenLM
Comments
ลองแล้วแจ่มเลยทีเดียว
ใช้ภาษาไทย เข้าใจ prompt ดี แกล้งพิมพ์ตกหล่นเล็กน้อยก็ยังเข้าใจ
และไม่เจออักษรจีนหลุดปนมาเลย
เทียบกับ Llama 3 70B ที่ยังมีอักษรจีน อาหรับ ปนออกมาบ่อยครั้ง
Qwen 2 ถามไทยก็ตอบไทย ส่วน Llama 3 ชอบดื้อ ถามไทยตอบอังกฤษ
รอดูฟีดแบคจากหลายๆ แหล่งทดสอบละเอียด ลุ้นว่าจะแซง Llama 3 ใน leaderboard ต่างๆ ได้ไหม ... ไม่แน่ว่าอาจจะเร่งให้ meta ปล่อย Llama 3 400B มาเสียที จากเสียงลือกันว่า ที่ยังไม่ปล่อย เพราะทางการสหรัฐฯ กังวลว่าจีนจะได้ประโยชน์จากโอเพ่นซอร์สโมเดลใหญ่นั้น
สรุปว่า ตอนนี้เป็น LLM open source ที่น่าจะคุยไทยรู้เรื่องสุดแล้ว (ไม่นับ Llama2 ที่คนไทยเอามาเทรนในชื่อต่างๆ)
สงคราม LLM นี่สนุกดี เหมือน space race ยุคสงครามเย็นเลย 🔥
WE ARE THE 99%
“Qwen7-72B ทำได้เหนือกว่า Llama3-70B”
แก้เป็น “Qwen2-72B ทำได้เหนือกว่า Llama3-70B”
Llama3-7B -> Llama3-8B
ประทับใจตรงที่ทำ GGUF ให้เลย พร้อมใช้กับ ollama
มากกว่า 128K อีก!
บล็อก: wannaphong.com และ Python 3
128 × 1,024 = 131,072
สอนผมเล่นน่อยครับ 😂
ผมพูดจริงๆนะ อยากลอง ภาษาลาว ไม่รู้ต้องตั้งค่ายังไง
ถ้าแค่ลองเล่น น่าจะกดลิงค์
https://huggingface.co/spaces/aixsatoshi/Qwen-7B-instruct
แล้วไปพิมพ์ ภาษาลาว ในช่อง Type a message แล้วกด submit ได้เลยนะครับ
ผมลองรุ่น 72B ถือว่าแม่นมากครับ
ทั้งตั้งใจพิมพ์ผิด ก็แก้ในคำตอบให้เลย
ภาษาไทย ผมลองพิมพ์ ทุกตัวแต่ให้ค้องจ้องกัน
มันก็ตอบถูกความหมายที่ผมถาม
*ผมโหลด Gemini ในแอนดรอยด์มาเล่น
บ้างคำก็ตอบไม่ถูก บ้างคำก็ไม่เข้าใจ แถมยังตั้งแค่แทนที่
Google assistant ให้เองอีก