Tags:
Node Thumbnail

SCB 10X เปิดตัว Typhoon-7b เป็นโมเดลสร้างข้อความ หรือ LLM ภาษาไทยที่เอาชนะโมเดลทุกตัวในภาษาไทยตอนนี้ และมีประสิทธิภาพเทียบเท่ากับ GPT-3.5 ในภาษาไทย

การวัดผลประสิทธิภาพของโมเดลในภาษาไทย ทาง SCB 10X ได้พัฒนาชุดทดสอบวัดผลประสิทธิภาพโมเดล LLM ภาษาไทยชื่อ ThaiExam โดยวัดด้วยข้อสอบสำหรับเด็กมัธยมศึกษาตอนปลายและข้อมูลด้านการลงทุนจากผู้เชี่ยวชาญด้านการลงทุนในประเทศไทย พบว่าประสิทธิภาพโมเดล Typhoon-7b เหนือกว่าทุกโมเดลที่ปล่อยฟรีในภาษาไทยและมีคะแนนเทียบเท่ากับ GPT-3.5

No Description

นอกจากนี้ ทาง SCB 10X ได้ปล่อยโมเดลให้ใช้งานฟรี (Apache License 2.0) เป็นโมเดลพื้นฐานที่ยังไม่ผ่านการ fine tuning ใด ๆ หากใครต้องการนำไปใช้งาน แนะนำให้ fine tuning ด้วยข้อมูลที่ต้องการก่อนนำไปใช้งานจริง

รายละเอียดเชิงลึก โมเดลพัฒนาต่อมาจาก Mistral-7B โดยใส่ภาษาไทยเข้าไป 5 พันคำ แล้วเทรนโมเดลต่อจากเดิมด้วย LoRA ผลการทดลองพบว่า โมเดล Typhoon-7b สามารถประหยัดจำนวนคำ (token) ภาษาไทยได้มากกว่า GPT-4 ถึง 2.62 เท่า

No Description

โมเดลบน HF: https://huggingface.co/scb10x/typhoon-7b

ที่มา: Typhoon: Thai Large Language Models

Get latest news from Blognone

Comments

By: Mr.EYE on 23 December 2023 - 10:55 #1301803

เจ๋งเลยอ่ะ

By: langisser
In Love
on 25 December 2023 - 09:28 #1301898

มันคืออะไรนะอันนีั มันทำให้เราถามตอบด้วยภาษาไทยได้ดีขึ้นใช่มะ

By: LuvStry
ContributorAndroid
on 26 December 2023 - 09:54 #1301954 Reply to:1301898
LuvStry's picture

ถ้ารวมๆ ก็ใช่ครับ


Blognone = 138.1 news/w เยอะมากๆ

By: tom789
Windows Phone
on 25 December 2023 - 12:17 #1301909

เยี่ยม เลย