Tags:
Node Thumbnail

NVIDIA เปิดตัวโมเดล Nemotron-4 340B เป็นโมเดลสำหรับสร้างข้อมูลสังเคราะห์ (synthetic data) เพื่อใช้เทรนโมเดลภาษาขนาดใหญ่ LLM อีกทีหนึ่ง

จุดเด่นของ Nemotron-4 340B คือการสร้างข้อมูลคุณภาพสูงในราคาถูก ตัวสัญญาอนุญาตเป็น NVIDIA Open Model ใช้งานในเชิงพาณิชย์ได้ฟรี นำโมเดลไปดัดแปลงต่อได้

Nemotron-4 ประกอบด้วยโมเดล 3 ตัวทำงานร่วมกันคือ base, instruct, reward ปรับแต่งให้ทำงานกับเฟรมเวิร์ค NVIDIA NeMo และจะออกแพ็กเกจสำหรับ NVIDIA NIM ให้นำไปดีพลอยบนเครื่องต่างๆ ได้สะดวก โมเดลสามารถดาวน์โหลดได้แล้วจาก Hugging Face

No Description

ที่มา - NVIDIA

Get latest news from Blognone

Comments

By: big50000
AndroidSUSEUbuntu
on 17 June 2024 - 13:30 #1314767
big50000's picture

เอิ่ม ไม่ใช่ Inbreeding หรอกใช่ไหม

By: lew
FounderJusci's WriterMEconomicsAndroid
on 17 June 2024 - 16:12 #1314792 Reply to:1314767
lew's picture

จริงๆ กระบวนการ RHLF ที่กำเนิด GPT3.5 นี่ก็ค่อนข้าง inbreed นะครับ มีคนแตะนิดเดียวคือให้เลือก output ที่ชอบจาก 4 output ที่ gen มา


lewcpe.com, @wasonliw