Tags:
Node Thumbnail

Mark Chen (Chief Research Officer ของ OpenAI) แสดงความคิดเห็นผ่านทาง X (Twitter) ว่าขอแสดงความยินดีกับทีม DeepSeek ที่สามารถพัฒนาโมเดล LLM ให้มีความสามารถด้าน Reasoning เทียบเท่ากับ OpenAI o1 ได้

Chen กล่าวชื่นชมว่าทีมพัฒนา DeepSeek สามารถค้นพบแนวคิดหลักบางส่วนที่ทีม OpenAI ใช้ในการพัฒนา o1 ได้ด้วยตนเอง โดยระบุว่า "...they've independently found some of the core ideas that we did on our way to o1"

Chen แสดงความเห็นเพิ่มเติมว่า การวิพากษ์วิจารณ์จากภายนอกเกี่ยวกับเรื่องต้นทุน (cost) นั้นอาจเกินจริงไป โดยอธิบายว่าการพัฒนา LLM ที่สามารถสเกลได้ 2 แกนคือ Pre-training และ Reasoning นั้น แม้ว่าสามารถ optimize ร่วมกันทั้งสองแกนเพื่อลดต้นทุนได้ แต่ OpenAI ยังคงต้องการสเกล และผลักดันพลังประมวลผลให้สูงที่สุดในทั้งสองด้านอยู่ดี

Chen มองว่าด้วยความก้าวหน้าของการวิจัยด้าน Distillation ในปัจจุบัน การพยายามพัฒนาโมเดลด้าน "capability" และการ "ลดต้นทุน" จะแยกออกจากกันชัดเจนมากขึ้น (decoupled) ซึ่งหมายความว่า ความสามารถในการพัฒนาโมเดลที่มีต้นทุนต่ำลง (โดยเฉพาะการเพิ่ม latency อย่างในกรณีของ DeepSeek R1) ไม่ได้หมายความว่าจะสามารถพัฒนาโมเดลที่มีความสามารถดีขึ้นได้

Chen ปิดท้ายว่า OpenAI ยังคงมุ่งมั่นที่จะพัฒนา models ที่มีต้นทุนต่ำลง เขาเชื่อมั่นใน research roadmap ปัจจุบัน และเขายังตื่นเต้นที่จะเปิดตัวโมเดลที่มีประสิทธิภาพดีขึ้นอย่างต่อเนื่องภายในไตรมาสนี้ และในอนาคตแน่นอน

ที่มา: โพสต์ของ Mark Chen บน X

Get latest news from Blognone

Comments

By: lawson on 29 January 2025 - 22:24 #1332588

แล้วแนวคิดนั้นมันคืออะไรหละคุณเฉิน เขียนเพื่อให้อยากรู้เหรอ

By: anu
Contributor
on 30 January 2025 - 00:20 #1332596 Reply to:1332588

https://arxiv.org/abs/2501.12948

By: 7
Android
on 29 January 2025 - 22:37 #1332591
7's picture

เอาน่าๆ ยังไงก็คนจีนด้วยกัน ฮา

By: Jonathan_Job
WriteriPhoneUbuntuWindows
on 30 January 2025 - 03:11 #1332597 Reply to:1332591
Jonathan_Job's picture

ไต้หวันครับ

Ref: https://www.linkedin.com/pulse/rise-mark-chen-taiwanese-talent-leading-openais-research-andy-cheng-wygoc

By: phueksapa on 30 January 2025 - 10:26 #1332619

ชื่นชม❌
ขิงว่าผ่านจุดนั้นมานานแล้ว✅