Stability AI ผู้สร้างโมเดล Stable Diffusion ปัญญาประดิษฐ์สร้างภาพ ประกาศเปิดตัว StableLM โมเดลปัญญาประดิษฐ์ด้านภาษา โดยมีขุดแข็งคือบริษัทเปิดให้ใช้งานทั้งสำหรับงานวิจัยและใช้งานเชิงการค้า
โมเดล StableLM มีขนาดเริ่มต้น 3 พันล้านและ 7 พันล้านพารามิเตอร์ และเตรียมจะปล่อยโมเดลขนาดใหญ่ขึ้นที่ 15 พันล้าน และ 65 พันล้านพารามิเตอร์ต่อไป ชุดข้อมูลที่ใช้ฝึกปัญญาประดิษฐ์พัฒนาจาก The Pile ที่มีขนาด 825GiB แต่ทาง Stability AI ขยายชุดข้อมูลจนมีขนาด 1.5 ล้านล้านโทเค็น และทางบริษัทเตรียมจะเปิดชุดข้อมูลให้ภายนอกใช้งานด้วย
ตัว StableLM เป็นเพียงโมเดลฐานใช้สร้างข้อความ แบบเดียวกับ GPT-3 การที่ปัญญาประดิษฐ์จะถามตอบได้มีคุณภาพต้องอาศัยการฝึกถามตอบเพิ่มเติมจนเป็น ChatGPT รอบนี้ทาง Stability AI ปล่อยโมเดลที่ฝึกถามตอบคำถามมาแล้วด้วย แต่ระบุไลเซนส์แบบห้ามใช้งานเชิงการค้า ต่างจากโมเดลฐาน
ความนิยมของ ChatGPT ทำให้มีโครงการจำนวนมากพยายามพัฒนาให้ความสามารถใกล้เคียงกัน โครงการจำนวนมากแม้จะเปิดให้ดาวน์โหลดไปใช้งานแต่จำกัดการใช้งานให้ใช้เพื่องานวิจัยเท่านั้น แต่ก็มีหลายโครงการ เช่น Dolly ที่เปิดให้ใช้งานเชิงการค้าได้เต็มรูปแบบ
ที่มา - Stability AI
ตัวอย่างข้อความจาก StableLM ที่ฝึกแบบ fine-tune เพื่อการถามตอบคำถามแล้ว