กูเกิลเปิดตัว Gemma โมเดลภาษาโอเพนซอร์ส โครงสร้างเดียวกับ Gemini ใช้งานเชิงพาณิชย์ได้

By: mk

on 21 February 2024 - 20:45 Tags:

Topics:

กูเกิลเปิดตัว Gemma โมเดลภาษาแบบโอเพนซอร์ส ที่ได้แรงบันดาลใจมาจาก Gemini โมเดลเชิงพาณิชย์ของตัวเอง และพัฒนาโดยทีม Google DeepMind เหมือนกัน มีโครงสร้างทางเทคนิคบางส่วนเหมือนกัน

กูเกิลปล่อย Gemma ออกมา 2 ขนาดคือ 2B และ 7B (ดาวน์โหลดได้จาก Kaggle หรือ Hugging Face) โดยระบุว่าโมเดลขนาด 7B สามารถเอาชนะคู่แข่งที่ระดับเดียวกันคือ Llama 7B ในเบนช์มาร์คต่างๆ ได้ค่อนข้างทิ้งห่าง และเอาชนะได้แม้กระทั่ง Llama 13B ที่มีขนาดใหญ่กว่าได้ด้วยซ้ำ

อีกประเด็นที่น่าสนใจคือ Gemma อนุญาตให้ใช้งานเชิงพาณิชย์ได้เต็มรูปแบบ ตรงนี้แตกต่างจาก Llama ที่อนุญาตเกือบทุกกรณี ยกเว้นการใช้งานโดยบริษัทขนาดใหญ่มากๆ ระดับคู่แข่งของ Meta

ส่วนเรื่องเครื่องมือต่างๆ กูเกิลก็เตรียมความพร้อมไว้ครบครัน ทั้งการใช้งานบน Google Cloud โดยปรับแต่งให้รันได้ทั้ง Google Cloud TPU และ NVIDIA GPU ฝั่งซอฟต์แวร์มีเครื่องมือพร้อมบน JAX, PyTorch, TensorFlow, Keras รวมถึงการออกแบบขนาดของโมเดลให้สามารถรันในพีซีของนักพัฒนาได้โดยตรงด้วย

No Description

ที่มา - Google