Tags:
Node Thumbnail

ทีมวิจัย Qwen ของ Alibaba Cloud เปิดตัวโมเดล LLM ในชื่อ Qwen2 มี 5 ขนาดให้เลือกตั้งแต่ 0.5B, 1.5B, 7B, 14B, และ 72B โดยชูจุดเด่นรองรับภาษาอื่นๆ นอกจากภาษาอังกฤษ เช่นแถบเอเชียตะวันออกเฉียงใต้นั้นรองรับทั้ง ไทย, เวียดนาม, อินโดนีเซีย, เมียนมาร์, ลาว, กัมพูชา และยังรองรับ context window ถึง 128K

ผลทดสอบยอดนิยมเช่น MMLU หรือ HumanEval นั้น Qwen2-72B ทำได้เหนือกว่า Llama3-70B ไปเล็กน้อย ขณะที่ Qwen2-7B ก็เอาชนะ Llama3-7B ได้หลายชุดทดสอบโดยเฉพาะชุดทดสอบ HumanEval ที่คะแนนนำค่อนข้างมาก

Qwen2 ปล่อยให้ใช้งานแบบ Apache 2.0 ยกเว้นเฉพาะ Qwen2-72B เท่านั้นที่ยังจำกัดการใช้งานแบบ Qianwen License ทำให้โมเดลขนาด 7B สามารถใช้งานได้แทบไม่มีข้อจำกัด

สามารถทดลองใช้งานได้ใน HuggingFace ทั้งรุ่น 7B, และรุ่น 72B

ที่มา - QwenLM

No Description

Get latest news from Blognone

Comments

By: Fzo
ContributorAndroid
on 7 June 2024 - 02:50 #1313827
Fzo's picture

ลองแล้วแจ่มเลยทีเดียว
ใช้ภาษาไทย เข้าใจ prompt ดี แกล้งพิมพ์ตกหล่นเล็กน้อยก็ยังเข้าใจ

และไม่เจออักษรจีนหลุดปนมาเลย
เทียบกับ Llama 3 70B ที่ยังมีอักษรจีน อาหรับ ปนออกมาบ่อยครั้ง

Qwen 2 ถามไทยก็ตอบไทย ส่วน Llama 3 ชอบดื้อ ถามไทยตอบอังกฤษ

รอดูฟีดแบคจากหลายๆ แหล่งทดสอบละเอียด ลุ้นว่าจะแซง Llama 3 ใน leaderboard ต่างๆ ได้ไหม ... ไม่แน่ว่าอาจจะเร่งให้ meta ปล่อย Llama 3 400B มาเสียที จากเสียงลือกันว่า ที่ยังไม่ปล่อย เพราะทางการสหรัฐฯ กังวลว่าจีนจะได้ประโยชน์จากโอเพ่นซอร์สโมเดลใหญ่นั้น

สรุปว่า ตอนนี้เป็น LLM open source ที่น่าจะคุยไทยรู้เรื่องสุดแล้ว (ไม่นับ Llama2 ที่คนไทยเอามาเทรนในชื่อต่างๆ)

สงคราม LLM นี่สนุกดี เหมือน space race ยุคสงครามเย็นเลย 🔥


WE ARE THE 99%

By: rbus
ContributoriPhoneAndroidUbuntu
on 7 June 2024 - 07:03 #1313832

“Qwen7-72B ทำได้เหนือกว่า Llama3-70B”
แก้เป็น “Qwen2-72B ทำได้เหนือกว่า Llama3-70B”

By: gooGof
ContributorAndroidIn Love
on 7 June 2024 - 07:40 #1313834

Llama3-7B -> Llama3-8B

By: veer
Windows PhoneUbuntu
on 7 June 2024 - 11:15 #1313854
veer's picture

ประทับใจตรงที่ทำ GGUF ให้เลย พร้อมใช้กับ ollama

By: tontan
ContributorAndroidSymbianUbuntu
on 7 June 2024 - 12:45 #1313860
tontan's picture

context length of up to 131,072 tokens

มากกว่า 128K อีก!


บล็อก: wannaphong.com และ Python 3

By: hisoft
ContributorWindows PhoneWindows
on 7 June 2024 - 13:09 #1313863 Reply to:1313860
hisoft's picture

128 × 1,024 = 131,072

By: N Pack on 7 June 2024 - 14:11 #1313867
N Pack's picture

สอนผมเล่นน่อยครับ 😂
ผมพูดจริงๆนะ อยากลอง ภาษาลาว ไม่รู้ต้องตั้งค่ายังไง

By: sukoom2001
ContributorAndroidUbuntu
on 7 June 2024 - 18:33 #1313901 Reply to:1313867
sukoom2001's picture

ถ้าแค่ลองเล่น น่าจะกดลิงค์

https://huggingface.co/spaces/aixsatoshi/Qwen-7B-instruct

แล้วไปพิมพ์ ภาษาลาว ในช่อง Type a message แล้วกด submit ได้เลยนะครับ

By: N Pack on 7 June 2024 - 21:56 #1313916 Reply to:1313901
N Pack's picture

ผมลองรุ่น 72B ถือว่าแม่นมากครับ
ทั้งตั้งใจพิมพ์ผิด ก็แก้ในคำตอบให้เลย
ภาษาไทย ผมลองพิมพ์ ทุกตัวแต่ให้ค้องจ้องกัน
มันก็ตอบถูกความหมายที่ผมถาม

*ผมโหลด Gemini ในแอนดรอยด์มาเล่น
บ้างคำก็ตอบไม่ถูก บ้างคำก็ไม่เข้าใจ แถมยังตั้งแค่แทนที่
Google assistant ให้เองอีก