OpenAI พบโมเดล o3 และ o4-mini มีอัตราหลอนสูงกว่าโมเดลรุ่นเก่า ยังหาคำตอบไม่ได้ว่าทำไม

By: arjin

on 19 April 2025 - 12:16 Tags:

Topics:

OpenAI

LLM

OpenAI เปิดตัวโมเดล AI ที่คิดเป็นขั้นตอนก่อนตอบรุ่นล่าสุด o3 และ o4-mini ที่ระบุว่ามีประสิทธิภาพสูง ทำคะแนนจากผลการทดสอบได้ดี อย่างไรก็ตามโมเดลนี้ยังมีปัญหาที่กำลังแก้ไขอยู่

OpenAI เผยแพร่ข้อมูลใน System Card เกี่ยวกับโมเดล o3 และ o4-mini นี้ พูดถึงอาการหลอนหรือ Hallucination ในชุดทดสอบ PersonQA พบอัตราการหลอนของทั้ง 2 โมเดลนี้ สูงกว่าโมเดลคิดเป็นขั้นตอนรุ่นเก่าอย่าง o1

OpenAI บอกว่ายังอธิบายสาเหตุไม่ได้ ว่าทำไมที่โมเดลรุ่นใหม่จึงมีอาการหลอนมากกว่าโมเดลที่มีความสามารถน้อยกว่า ซึ่งเป็นแนวโน้มตรงข้ามกับที่ควรเป็น (โมเดลข้อมูลน้อย หลอนง่ายกว่า) จึงต้องทำการศึกษาวิจัยหาคำตอบเรื่องนี้เพิ่มเติม

ที่มา: TechCrunch

No Description

Hiring! บริษัทที่น่าสนใจ

KKP Dime

KKP Dime บริษัทในเครือเกียรตินาคินภัทร

Iron Software

Iron Software is an American company providing a suite of .NET libraries by engineer for engineers.

Carmen Software

Hotel Financial Solutions

Comments

By: Azymik on 19 April 2025 - 13:22 #1338490

เดาว่า ข้อมูลเยอะจน over-fitting

By: may2190 on 19 April 2025 - 16:50 #1338497

ฉลาดเยอะ = หลอนเยอะ

By: Aize

on 19 April 2025 - 19:56 #1338502

ข้อมูลเยอะเลยเชื่อมโยงกันมั่วๆ เปล่าหว่า

The Dream hacker..

By: tontan

on 19 April 2025 - 20:50 #1338505 Reply to:1338502

ผมเริ่มสงสัยแล้วว่าจะเป็นเอา machine translation แปลชุดข้อมูลภาษาอังกฤษไปเป็นภาษาอื่น ๆ แล้วเทรน มันดูดีขึ้นจริง แต่กลับเกิดอาการนี้รึเปล่า

บล็อก: wannaphong.com และ Python 3

By: N Pack on 19 April 2025 - 21:57 #1338506

เทรนด์จนไม่ไม่ได้หลับได้หลอนต้องใช้ยาช่วย
มันก็หลอนเป็นธรรมดา

By: SilentHeal

on 19 April 2025 - 22:02 #1338507

เข้าสเตรท valley of despair รึเปล่า พอรู้เยอะ จะรู้สึกว่า ไม่รู้อะไรเลย

By: Architec

on 20 April 2025 - 16:29 #1338523

ถ้าเกิดว่าให้ดู evangelion ทุกภาคแล้วตอบว่าเข้าใจ แสดงว่าผิดปกติสินะ

By: tontpong

on 20 April 2025 - 21:37 #1338532

ที่ดูฉลาด , เพราะฝึกด้วย ข้อมูล จาก social ของ พวกดอกเตอร์/พวกกูรู ?

By: big50000

on 20 April 2025 - 22:19 #1338533

ในขณะที่ผมมองว่า อาจจะโดนข้อมูลที่เจนจาก AI ในเน็ตมาเทรนต่อจนหลอนเอง 55555

By: orchidkit on 21 April 2025 - 01:57 #1338538

ผมว่าอยู่ในสถานะ "เลือกไม่ถูก"

-ทุกคำตอบมีค่าเท่ากัน เลยสุ่มเลือกตอบ
-Facts พ่ายแพ้ต่อความเห็นหรือการสมคบคิดที่มากมาย

By: Yone on 21 April 2025 - 17:54 #1338563

ใช้ Synthetic data มากไป?

By: au8ust

on 22 April 2025 - 18:02 #1338613

ยิ่ง chat ยาวเท่าไหร่ ยิ่งหลอนมากขึ้นเรื่อยๆ จนถึงจุดหนึ่ง มันจะเหมือนเอ๋อไปเลย คือตอบแบบเดิมซ้ำๆ โดยไม่สนใจว่าถามอะไร หรือพูดเรื่องอะไรอยู่ แต่พอเปลี่ยนกลับมา 4o จะใช้ได้ปกติ

Main menu