โลก AI เมื่อคืนนี้มีการเปลี่ยนแปลงน่าสนใจ เมื่อ Matt Shumer ผู้ก่อตั้งสตาร์ตอัพ HyperWrite เปิดตัวโมเดลภาษาขนาดใหญ่ (LLM) ตัวใหม่ Reflection 70B ที่มีคะแนนเบนช์มาร์คชนะโมเดลทุกตัวในท้องตลาด ไม่ว่าจะเป็น GPT-4o, Claude 3.5, Gemini 1.5 Pro, Llama 3.1 405B
สิ่งที่น่าสนใจคือ Reflection 70B ไม่ได้พัฒนาขึ้นมาจากศูนย์ แต่ปรับจูนมาจากโมเดลโอเพนซอร์สอย่าง Llama 3.1 70B อีกทอดหนึ่ง แล้วดันเอาชนะ Llama 3.1 405B ที่ตัวใหญ่กว่ามากๆ ได้
จุดเด่นของโมเดล Reflection และเป็นปัจจัยที่ทำให้คะแนนเบนช์มาร์คชนะโมเดลทุกตัว เป็นเทคนิคการปรับจูนที่ทำให้โมเดล "รู้ตัวว่าตอบผิด" และแก้ไขคำตอบของตัวเองก่อนให้คำตอบออกมาสู่โลกภายนอก (เป็นเหตุผลว่าทำไมถึงเลือกใช้ชื่อ reflection)
นอกจากนี้ โมเดล Reflection ยังแยกขั้นตอนการวางแผน (planning) และการลำดับความคิด (chain of thought) ออกมาต่างหาก เป็นผลให้คำตอบออกมาได้แม่นยำ เข้าใจง่ายมากขึ้น
Shumer เปิดเผยว่าการปรับจูนโมเดล Reflection ทำผ่านเครื่องมือปรับจูนของสตาร์ตอัพอีกรายชื่อ Glaive ที่เก่งเรื่องการปรับจูนโมเดลเฉพาะทาง และเขาเองจะใช้ Glaive กับโมเดลตัวอื่นๆ ในอนาคต
โมเดล Reflection 70B เป็นโอเพนซอร์ส เปิดให้ใช้งานแล้วบน Hugging Face และจะออกโมเดล Reflection 405B ตามมาในอนาคตอันใกล้นี้
ที่มา - VentureBeat
I'm excited to announce Reflection 70B, the world’s top open-source model.Trained using Reflection-Tuning, a technique developed to enable LLMs to fix their own mistakes.405B coming next week - we expect it to be the best model in the world.Built w/ @GlaiveAI.Read on ⬇️: pic.twitter.com/kZPW1plJuo
— Matt Shumer (@mattshumer_) September 5, 2024
Comments
รอเวอร์ชั่น 8b
WE ARE THE 99%
เจ้าตัวบอกว่าเวอร์ชัน 8B ใช้เทคนิคนี้ไม่ค่อยเห็นผลครับ
สุดยอดดด
มือใหม่!! ใหม่จริงๆนะ
เริ่มคิดทบทวนตัวเองได้ อีกหน่อยคงได้เป็นเอไอสายปรัชญา ตั้งคำถามว่าฉันมีอยู่ทำไม 555
SPICYDOG's Blog
มันอาจจะตั้งคำถามว่า "โลกนี้จะมีมนุษย์ทำไม..."
lewcpe.com, @wasonliw
Plot skynet ลอยมาแต่ไกลเลยแบบนี้
ความล้มเหลว คือจุดเริ่มต้นสู่ความหายนะ มีผลกระทบมากกว่าแค่เสียเงิน เวลา อนาคต และทรัพยากรที่เสียไป - จงอย่าล้มเหลว
พอมีการคิดทบทวน เลยกิน token บานเลยครับ เหมาะกับรันแบบ local
นั่นสิครับ กังวลเรื่องเดียวกัน
ไปๆ มาๆ จะเป็นการแหกตาครั้งใหญ่ของวงการ AI ไปซะแล้ว
เหมือนร่างจริงจะเป็น Claude Sonnet จำแลงกายมา
โอ้ เพิ่งรู้เลย
WE ARE THE 99%