NVIDIA เปิดตัวโมเดล Nemotron-4 340B เป็นโมเดลสำหรับสร้างข้อมูลสังเคราะห์ (synthetic data) เพื่อใช้เทรนโมเดลภาษาขนาดใหญ่ LLM อีกทีหนึ่ง
จุดเด่นของ Nemotron-4 340B คือการสร้างข้อมูลคุณภาพสูงในราคาถูก ตัวสัญญาอนุญาตเป็น NVIDIA Open Model ใช้งานในเชิงพาณิชย์ได้ฟรี นำโมเดลไปดัดแปลงต่อได้
Nemotron-4 ประกอบด้วยโมเดล 3 ตัวทำงานร่วมกันคือ base, instruct, reward ปรับแต่งให้ทำงานกับเฟรมเวิร์ค NVIDIA NeMo และจะออกแพ็กเกจสำหรับ NVIDIA NIM ให้นำไปดีพลอยบนเครื่องต่างๆ ได้สะดวก โมเดลสามารถดาวน์โหลดได้แล้วจาก Hugging Face
ที่มา - NVIDIA
Comments
เอิ่ม ไม่ใช่ Inbreeding หรอกใช่ไหม
จริงๆ กระบวนการ RHLF ที่กำเนิด GPT3.5 นี่ก็ค่อนข้าง inbreed นะครับ มีคนแตะนิดเดียวคือให้เลือก output ที่ชอบจาก 4 output ที่ gen มา
lewcpe.com, @wasonliw