Alibaba Cloud เปิดตัวปัญญาประดิษฐ์ Qwen2 ใช้งานได้เสรี พร้อมรองรับภาษาไทย

By: lew

on 7 June 2024 - 01:24 Tags:

Topics:

ทีมวิจัย Qwen ของ Alibaba Cloud เปิดตัวโมเดล LLM ในชื่อ Qwen2 มี 5 ขนาดให้เลือกตั้งแต่ 0.5B, 1.5B, 7B, 14B, และ 72B โดยชูจุดเด่นรองรับภาษาอื่นๆ นอกจากภาษาอังกฤษ เช่นแถบเอเชียตะวันออกเฉียงใต้นั้นรองรับทั้ง ไทย, เวียดนาม, อินโดนีเซีย, เมียนมาร์, ลาว, กัมพูชา และยังรองรับ context window ถึง 128K

ผลทดสอบยอดนิยมเช่น MMLU หรือ HumanEval นั้น Qwen2-72B ทำได้เหนือกว่า Llama3-70B ไปเล็กน้อย ขณะที่ Qwen2-7B ก็เอาชนะ Llama3-7B ได้หลายชุดทดสอบโดยเฉพาะชุดทดสอบ HumanEval ที่คะแนนนำค่อนข้างมาก

Qwen2 ปล่อยให้ใช้งานแบบ Apache 2.0 ยกเว้นเฉพาะ Qwen2-72B เท่านั้นที่ยังจำกัดการใช้งานแบบ Qianwen License ทำให้โมเดลขนาด 7B สามารถใช้งานได้แทบไม่มีข้อจำกัด

สามารถทดลองใช้งานได้ใน HuggingFace ทั้งรุ่น 7B, และรุ่น 72B

ที่มา - QwenLM

No Description

Hiring! บริษัทที่น่าสนใจ

KKP Dime

KKP Dime บริษัทในเครือเกียรตินาคินภัทร

United Information Highway Co., Ltd.

UIH is Thailand’s leading Digital Infrastructure and Solution Provider for Business

Gofive

“We create world-class software experience”

Comments

By: Fzo

on 7 June 2024 - 02:50 #1313827

ลองแล้วแจ่มเลยทีเดียว
ใช้ภาษาไทย เข้าใจ prompt ดี แกล้งพิมพ์ตกหล่นเล็กน้อยก็ยังเข้าใจ

และไม่เจออักษรจีนหลุดปนมาเลย
เทียบกับ Llama 3 70B ที่ยังมีอักษรจีน อาหรับ ปนออกมาบ่อยครั้ง

Qwen 2 ถามไทยก็ตอบไทย ส่วน Llama 3 ชอบดื้อ ถามไทยตอบอังกฤษ

รอดูฟีดแบคจากหลายๆ แหล่งทดสอบละเอียด ลุ้นว่าจะแซง Llama 3 ใน leaderboard ต่างๆ ได้ไหม ... ไม่แน่ว่าอาจจะเร่งให้ meta ปล่อย Llama 3 400B มาเสียที จากเสียงลือกันว่า ที่ยังไม่ปล่อย เพราะทางการสหรัฐฯ กังวลว่าจีนจะได้ประโยชน์จากโอเพ่นซอร์สโมเดลใหญ่นั้น

สรุปว่า ตอนนี้เป็น LLM open source ที่น่าจะคุยไทยรู้เรื่องสุดแล้ว (ไม่นับ Llama2 ที่คนไทยเอามาเทรนในชื่อต่างๆ)

สงคราม LLM นี่สนุกดี เหมือน space race ยุคสงครามเย็นเลย 🔥

WE ARE THE 99%

By: rbus