Mark Chen หัวหน้าทีมวิจัย OpenAI ชื่นชม DeepSeek R1 ค้นพบไอเดียสำคัญของ OpenAI o1 ได้ด้วยตัวเอง

By: ShiRaTo

on 29 January 2025 - 19:58 Tags:

Topics:

OpenAI

DeepSeek

LLM

Artificial Intelligence

Mark Chen (Chief Research Officer ของ OpenAI) แสดงความคิดเห็นผ่านทาง X (Twitter) ว่าขอแสดงความยินดีกับทีม DeepSeek ที่สามารถพัฒนาโมเดล LLM ให้มีความสามารถด้าน Reasoning เทียบเท่ากับ OpenAI o1 ได้

Chen กล่าวชื่นชมว่าทีมพัฒนา DeepSeek สามารถค้นพบแนวคิดหลักบางส่วนที่ทีม OpenAI ใช้ในการพัฒนา o1 ได้ด้วยตนเอง โดยระบุว่า "...they've independently found some of the core ideas that we did on our way to o1"

Congrats to DeepSeek on producing an o1-level reasoning model! Their research paper demonstrates that they’ve independently found some of the core ideas that we did on our way to o1.

— Mark Chen (@markchen90) January 28, 2025

Chen แสดงความเห็นเพิ่มเติมว่า การวิพากษ์วิจารณ์จากภายนอกเกี่ยวกับเรื่องต้นทุน (cost) นั้นอาจเกินจริงไป โดยอธิบายว่าการพัฒนา LLM ที่สามารถสเกลได้ 2 แกนคือ Pre-training และ Reasoning นั้น แม้ว่าสามารถ optimize ร่วมกันทั้งสองแกนเพื่อลดต้นทุนได้ แต่ OpenAI ยังคงต้องการสเกล และผลักดันพลังประมวลผลให้สูงที่สุดในทั้งสองด้านอยู่ดี

Chen มองว่าด้วยความก้าวหน้าของการวิจัยด้าน Distillation ในปัจจุบัน การพยายามพัฒนาโมเดลด้าน "capability" และการ "ลดต้นทุน" จะแยกออกจากกันชัดเจนมากขึ้น (decoupled) ซึ่งหมายความว่า ความสามารถในการพัฒนาโมเดลที่มีต้นทุนต่ำลง (โดยเฉพาะการเพิ่ม latency อย่างในกรณีของ DeepSeek R1) ไม่ได้หมายความว่าจะสามารถพัฒนาโมเดลที่มีความสามารถดีขึ้นได้

Chen ปิดท้ายว่า OpenAI ยังคงมุ่งมั่นที่จะพัฒนา models ที่มีต้นทุนต่ำลง เขาเชื่อมั่นใน research roadmap ปัจจุบัน และเขายังตื่นเต้นที่จะเปิดตัวโมเดลที่มีประสิทธิภาพดีขึ้นอย่างต่อเนื่องภายในไตรมาสนี้ และในอนาคตแน่นอน

ที่มา: โพสต์ของ Mark Chen บน X