Tags:
Node Thumbnail

กูเกิลเปิดตัว DataGemma โมเดล LLM ที่ออกแบบมาเพื่อแก้ปัญหาหลอน (hallucination) ที่มักพบในโมเดล LLM จากการมั่นใจแล้วให้ข้อมูลที่ผิดพลาด ซึ่งกูเกิลแก้ปัญหานี้ด้วยการเชื่อมต่อกับฐานข้อมูลปัจจุบันในการอ้างอิง

แพลตฟอร์มที่กูเกิลใช้เรียกว่า Data Commons เป็น Knowledge Graph ที่มีชุดข้อมูลมากกว่า 240 พันล้านจุด ใช้แหล่งข้อมูลที่น่าเชื่อถือทั้งจาก United Nations (UN), World Health Organization (WHO), Centers for Disease Control and Prevention (CDC) และ Census Bureaus ทำให้ได้ผลลัพธ์เป็น AI ที่สามารถให้ข้อมูลที่ถูกต้อง

No Description

กูเกิลใช้สองวิธีการที่เพิ่มเติมใน Gemma ให้เชื่อมต่อข้อมูลกับ Data Commons วิธีแรกคือ RIG (Retrieval-Interleaved Generation) โดยโมเดลถูกกำหนดให้ต้องระบุสถิติอ้างอิงกับ Data Commons เสมอเมื่อให้คำตอบ และวิธี RAG (Retrieval-Augmented Generation) ให้โมเดลต้องเพิ่ม context กับ Data Commons เพื่อเสริมข้อมูลก่อนที่จะให้คำตอบ

No Description

ผลทดสอบการทำงานของ LLM ร่วมกับวิธี RIG และ RAG พบว่าโมเดลสามารถตอบคำถามที่ต้องการความแม่นยำถูกต้องของข้อมูลได้ดีขึ้นจากโมเดลปกติ 5-17%

ดูรายละเอียดเพิ่มเติมของ DataGemma ได้ที่ Hugging Face ซึ่งเปิดให้ใช้งานสำหรับภาคการศึกษาและการวิจัย

ที่มา: กูเกิล

Get latest news from Blognone