Tags:
Node Thumbnail

ServiceNow, Hugging Face และ NVIDIA เปิดตัว StarCoder2 ชุดโมเดลภาษาขนาดใหญ่ (LLM) ที่เปิดให้ใช้งานได้ฟรี (open-access) สำหรับงานเขียนโค้ด ซึ่งมีจุดเด่นคือประสิทธิภาพการทำงาน ความโปร่งใสของ AI และช่วยในการจัดการต้นทุน

StarCoder2 เป็นโครงการของชุมชน BigCode ที่ให้การสนับสนุนโดย ServiceNow และ Hugging Face โมเดลถูกเทรนบนภาษาเขียนโปรแกรม 619 ภาษา ออกแบบมาให้สามารถทำงานร่วมกับแอพพลิเคชันภายในองค์กร สำหรับงานต่าง ๆ เช่น ช่วยสร้างซอร์สโค้ด, สร้างเวิร์กโฟลว์, เขียนสรุปเนื้อหา และอื่น ๆ องค์กรสามารถนำไปใช้งาน โดยอาศัยการปรับแต่งด้วยทรัพยากรที่ไม่ต้องสูงมาก

StarCoder2 มีโมเดลให้ใช้งาน 3 ขนาด ตัวแรกเป็นโมเดลขนาด 3 พันล้านพารามิเตอร์ ซึ่งเทรนด้วยเฟรมเวิร์ก Fast LLM ของ ServiceNow, โมเดล 7 พันล้านพารามิเตอร์ เทรนด้วยเฟรมเวิร์ก nanotron ของ Hugging Face และโมเดลใหญ่ที่สุด 15 พันล้านพารามิเตอร์ สร้างจาก NVIDIA NeMo และเทรนบนทรัพยากรคลาวด์ของ NVIDIA

ชุดข้อมูลของ StarCoder2 เป็นการปรับปรุงจากรุ่นก่อนหน้า โดยสามารถเข้าใจภาษาแบบ low-resource เช่น COBOL ตลอดจนทำงานส่วนคณิตศาสตร์ได้ด้วย

StarCoder2 เปิดให้ใช้งานได้ภายใต้ไลเซนส์ของ BigCode Open RAIL-M ไม่มีการคิดค่าธรรมเนียมในการใช้งาน ดูรายละเอียดเพิ่มเติมได้ที่ GitHub ของโครงการ

ที่มา: ServiceNow

No Description

Get latest news from Blognone