Tags:
Node Thumbnail

Alibaba Cloud เปิดซอร์สโค้ดของโมเดลภาษาขนาดใหญ่ (LLM) ชื่อ Tongyi Qianwen ที่เคยเปิดตัวครั้งแรกเมื่อเดือนเมษายน 2023 ออกสู่สาธารณะ

โมเดลที่เปิดซอร์สโค้ดออกมายังมีเฉพาะรุ่นเล็ก Qianwen-7B และ Qianwen-7B-Chat ขนาด 7 พันล้านพารามิเตอร์ รองรับบทสนทนาขนาดยาว 8K, คลังคำศัพท์ 150K tokens (Qianwen ตัวเต็มมีขนาดใหญ่ถึง 10 ล้านล้านพารามิเตอร์ และถูกใช้กับบ็อตสนทนาของ Alibaba เอง เช่น DingTalk หรือ Tmall Genie)

Alibaba บอกว่าจุดเด่นของ Qianwen-7B คือทำคะแนนเบนช์มาร์คได้ดีกว่าโมเดลขนาดใกล้เคียงกัน เช่น LLaMA หรือ LLaMA 2 ของ Meta (13 พันล้านพารามิเตอร์) แถมสัญญาอนุญาตเปิดกว้างกว่าของ Meta มาก นั่นคือนำไปใช้ในเชิงพาณิชย์ได้แบบไม่มีเงื่อนไขใดๆ (สัญญาอนุญาตตัวเต็ม)

ตัวโมเดลอยู่บน HuggingFace และ ModelScope ที่เป็นเว็บจีนของ Alibaba ส่วนซอร์สโค้ดอยู่บน GitHub

ก่อนหน้านี้ไม่นาน Alibaba เพิ่งเปิดตัวโมเดลอีกตัวชื่อคล้ายกันคือ Tongyi Wanxiang แต่เป็นโมเดลอีกประเภทคือสร้างภาพด้วย AI และยังไม่เปิดซอร์สโค้ดออกมา

No Description

No Description

ที่มา - Alibaba

Get latest news from Blognone