update: เวอร์ชั่นแรกขอข่าวนี้พาดหัวว่ายังไม่รองรับภาษาไทย แต่เมื่อทดสอบแล้วจำนวนโทเค็นในภาษาไทยลดลงกว่าเท่าตัว
ในงานเปิดตัว GPT-4o ของ OpenAI นอกจากประเด็นโมเดลมีประสิทธิภาพสูงขึ้นแล้ว ยังมีประเด็นการออปติไมซ์ tokenizer เพื่อให้ใช้งานภาษาอื่นๆ นอกจากภาษาอังกฤษได้ดีขึ้น โดยทีมงาน OpenAI เลือกมา 20 ภาษารวมถึงภาษาอังกฤษแต่ยังไม่มีภาษาไทย ทำให้ภาษาเหล่านี้ใช้งานได้มีประสิทธิภาพมากขึ้นเพราะคำในภาษาเหล่านี้มีจำนวนโทเค็นน้อยลง
OpenAI เปิดตัว GPT-4 รุ่นใหม่ในชื่อ GPT-4o (โฟร์-โอ) ความสามารถใกล้เคียง GPT-4 แต่ความเร็วสูงกว่า ขณะที่ยังมีความสามารถรองรับอินพุตหลายแบบ (multimodal) สามารถฟังเสียงและอ่านภาพได้โดยไม่ต้องการโมเดลปัญญาประดิษฐ์ speech-to-text แยก
เนื่องจากประสิทธิภาพ GPT-4o สูงกว่าทำให้ OpenAI สามารถเปิดให้ผู้ใช้ทุกคนใช้งานได้ฟรีโดยมีโควต้ามากขึ้น สำหรับการใช้งานฝั่ง API ราคาของ GPT-4o จะถูกกว่า GPT-4 Turbo ลงครึ่งหนึ่ง ความเร็วโดยรวมเพิ่มขึ้นเท่าตัว และโควต้าการใช้งานเพิ่มขึ้นถึง 5 เท่า
Sora โมเดล AI สร้างวิดีโอขนาดยาวและมีคุณภาพสูงของ OpenAI ที่เปิดตัวไปเมื่อต้นปี ยังคงถูกตั้งคำถามอยู่ตลอดว่าใช้ข้อมูลอะไรมาเทรนเพื่อสร้างวิดีโอ โดยเฉพาะคลังข้อมูลวิดีโอขนาดใหญ่อย่าง YouTube
ก่อนหน้านี้ Mira Murati ซีทีโอ OpenAI ปฏิเสธที่จะให้คำตอบจากคำถามว่า Sora ใช้วิดีโอ YouTube มาเทรนข้อมูลหรือไม่ จนทำให้ซีอีโอ YouTube ออกมาบอกว่าถ้า Sora ใช้วิดีโอ YouTube ในการเทรน ก็เป็นการละเมิดข้อกำหนดการใช้งาน
มีประเด็นต่อเนื่องจากรายงานเรื่อง Siri จะปรับปรุงความสามารถด้วย Generative AI ซึ่งแอปเปิลมีสองแนวทางคือ ใช้ AI พัฒนาเองที่ชื่อ Ajax และร่วมมือกับพาร์ตเนอร์ภายนอกซึ่งมีทั้ง OpenAI และกูเกิล
โดยรายงานล่าสุดของ Mark Gurman แห่ง Bloomberg บอกว่าตอนนี้การเจรจาของแอปเปิลกับ OpenAI มีความคืบหน้ามาก ใกล้ได้ข้อสรุปเพื่อนำ ChatGPT มาเป็นฟีเจอร์หนึ่งใน iOS 18 แล้ว ส่วนการเจรจากูเกิลเพื่อนำ Gemini มาใช้งาน ก็ยังคงดำเนินต่อไป แต่ยังไม่มีข้อมูลว่าไปถึงระดับไหน
OpenAI ประกาศจัดงานแถลงข่าว ในเวลาเที่ยงคืนเข้าสู่วันอังคารที่ 14 พฤษภาคมนี้ (คืนวันที่ 13 พฤษภาคม) ตามเวลาในประเทศไทย โดยถ่ายทอดสดผ่านทาง openai.com ตรงตามข่าวที่ออกมาก่อนหน้านี้
หัวข้องานชื่อว่า Spring Updates โดย OpenAI บอกว่าจะมีการสาธิตอัปเดตของ ChatGPT และ GPT-4 จึงเป็นไปได้ว่าจะเปิดตัว Search Engine ตามข่าวลือที่ออกมา อย่างไรก็ตาม Sam Altman ซีอีโอ OpenAI ก็โพสต์ข้อความสยบข่าวลือก่อนเลยว่า ไม่ใช่ GPT-5 ไม่ใช่ Search Engine แต่เป็นสิ่งที่ทุกคนจะรัก
Reuters รายงานข่าวลือว่า OpenAI เตรียมเปิดตัว Search Engine ของตัวเองในวันจันทร์หน้า (13 พ.ค.)
ก่อนหน้านี้มีข่าวลือมาสักระยะแล้วว่า OpenAI กำลังซุ่มพัฒนา Search Engine เพื่อแข่งกับ Google Search และสตาร์ตอัพรายอื่นอย่าง Perplexity AI ที่ก่อตั้งโดยอดีตพนักงานของ OpenAI
คาดว่าบริการ Search ของ OpenAI จะเป็นส่วนต่อขยายจาก ChatGPT โดยเปิดให้ ChatGPT ดึงข้อมูลจากอินเทอร์เน็ต มีแหล่งอ้างอิงข้อมูล (ไม่ได้เรียกว่า Bing งั้นรึ?)
OpenAI เผยแพร่เอกสาร (document) เรียกว่า Model Spec ซึ่งเป็นร่างเวอร์ชันแรก เพื่ออธิบายเบื้องหลังการตัดสินใจและพฤติกรรมของโมเดล AI ที่ใช้ใน OpenAI API และ ChatGPT ซึ่งช่วยให้ผู้ใช้งานเข้าใจวัตถุประสงค์ และกรณีต่าง ๆ ที่โมเดล AI ตัดสินใจทำหรือไม่ทำ
เป้าหมายของ Model Spec คือการกำหนดค่าสามส่วนได้แก่ Objectives หรือสิ่งที่ต้องการทำ, Rules กฎที่ตรวจสอบ, Default behaviors เทมเพลตพื้นฐานในการกำหนดรูปแบบการโต้ตอบ ทั้งหมดนี้สามารถเปลี่ยนแปลงได้เมื่อเวลาผ่านไป
OpenAI บอกว่าเอกสาร Model Spec นี้ ปัจจุบันถูกใช้เป็นกฎขั้นสูงในการควบคุมจัดการ ChatGPT และโมเดล AI ต่าง ๆ ที่พัฒนาใน OpenAI ผ่านการทดสอบซ้ำและเก็บรวบรวมความเห็นจากมนุษย์
หลังจาก OpenAI ตกลงซื้อข้อมูลจาก Stack Overflow นำข้อมูลไปฝึกปัญญาประดิษฐ์ ผู้ใช้บางส่วนก็แสดงความไม่พอใจ ผู้ใช้ชื่อบัญชี benui ก็พยายามลบคำตอบของตัวเอง แต่กลับถูกล็อกบัญชี
benui ระบุว่าตอนแรกเขาพยายามลบคำตอบแต่ก็พบว่า Stack Overflow ล็อกไม่ให้ลบคำตอบที่ถูกยอมรับแล้วและมีโหวตจำนวนมาก เขาจึงพยายามแก้คำตอบเพื่อประท้วงแต่ผู้ดูแลเว็บก็แก้คำตอบกลับภายในเวลาไม่นาน และล็อกบัญชีของเขาเป็นเวลา 7 วัน
ไม่แน่ชัดว่าตอนนี้มีผู้ใช้พยายามลบหรือแก้คำตอบเพื่อประท้วงมากน้อยเพียงใด แต่ benui ยืนยันว่าจะพยายามขอลบข้อมูลด้วยกระบวนการ GDPR ต่อไป
The Information รายงานข่าวลือว่า ไมโครซอฟท์กำลังเทรนโมเดลภาษาขนาดใหญ่ของตัวเองชื่อ MAI-1 มีขนาด 5 แสนล้านพารามิเตอร์ และมีศักยภาพทำงานได้ระดับเดียวกับโมเดลของ OpenAI, Google หรือ Anthropic ในปัจจุบัน โครงการนี้มีหัวหน้าโครงการคือ Mustafa Suleyman ผู้ร่วมก่อตั้ง DeepMind ที่เพิ่งย้ายจากบริษัท Inflection AI มาเป็นซีอีโอ Microsoft AI
ข่าวของ MAI-1 มีความสำคัญตรงที่เป็นครั้งแรกที่ไมโครซอฟท์ทำโมเดล LLM เอง หลังจากต้องพึ่งพาโมเดล GPT ของ OpenAI มาตลอดในช่วงประมาณ 2 ปีที่ผ่านมา และปัญหาดราม่าภายใน OpenAI น่าจะเป็นสิ่งเตือนใจไมโครซอฟท์ว่าไม่ควรพึ่งพาบริษัทภายนอกมากจนเกินไป
Stack Overflow ประกาศบรรลุข้อตกลงกับ OpenAI ในการขายข้อมูลผ่าน API เพื่อไปใช้เทรนโมเดล LLM อย่างเป็นทางการ ถัดจาก Google Gemini ที่ประกาศข่าวนี้ไปตั้งแต่เดือนมีนาคม
รูปแบบข้อตกลงฝั่งซื้อข้อมูลคงไม่ต่างกัน คือ OpenAI จะใช้ข้อมูลจาก OverflowAPI ไปใช้ปรับปรุงโมเดลของตัวเอง แต่สิ่งที่เพิ่มเข้ามาจากข้อตกลงของกูเกิลคือ ในด้านกลับ Stack Overflow จะใช้โมเดลของ OpenAI เป็นส่วนหนึ่งของบริการ OverflowAI ของตัวเองด้วย โดยบริการจะออกมาให้เห็นกันภายในครึ่งแรกของปี 2024
Stack Overflow เปิด API ให้บริษัทปัญญาประดิษฐ์ดูดข้อมูลไปใช้ตั้งแต่ต้นปีที่ผ่านมาโดยมีลูกค้ารายแรกคือกูเกิล ตอนนี้ OpenAI ก็ประกาศใช้บริการนี้เหมือนกัน
ประกาศครั้งนี้มีประเด็นเพิ่มเติม คือทาง Stack Overflow จะใช้บริการของ OpenAI มาสร้าง OverflowAI สำหรับช่วยตอบคำถามภายในองค์กรเอง
ทาง Stack Overflow ระบุว่าจะเริ่มเห็นผลของการแลกเปลี่ยนครั้งนี้ภายในกลางปี 2024 นี้ โดยไม่ระบุว่าเป็นอะไร ความเป็นไปได้มีหลากหลาย เช่น ChatGPT อาจจะอ้างอิงกระทู้ใน Stack Overflow โดยตรง, มีโมเดลรุ่นใหม่ที่ฝึกจากชุดข้อมูล Stack Overflow, หรืออาจจะเป็นฝั่ง Stack Overflow ปล่อยบริการ OverflowAI ออกมาก่อน
กระทรวงยุติธรรมสหรัฐ (DoJ) ยื่นฟ้องกูเกิลในคดีผูกขาด search มาตั้งแต่ปี 2020 เวลาผ่านมา 3 ปีกว่า กระบวนการยังอยู่ในชั้นศาล โดยทั้งสองฝ่ายจะแถลงปิดคดีกันภายในเดือนนี้ (พฤษภาคม 2024)
ในการไต่สวนชั้นศาล DoJ ได้เรียกพยานและเอกสารจากคู่แข่งของกูเกิลมาหลายราย หนึ่งในนั้นคือไมโครซอฟท์ และล่าสุดมีอีเมลภายในของไมโครซอฟท์ถูกนำมาใช้อ้างอิงในคดี ทำให้เรามีโอกาสเห็นเบื้องหลังว่าไมโครซอฟท์คิดอย่างไร ถึงไปลงทุนใน OpenAI
อีเมลชุดนี้เขียนขึ้นโดย Kevin Scott ซีทีโอของไมโครซอฟท์ ส่งหา Satya Nadella และ Bill Gates ในเดือนมิถุนายน 2019 มีหัวข้อว่า "Thoughts on OpenAI"
เว็บจัดอันดับแชตบอต LMSYS มีปัญญาประดิษฐ์ตัวใหม่เพิ่มเข้ามาคือ gpt2-chatbot โดยไม่มีคำอธิบายว่ามันคือโมเดลอะไร แต่เมื่อทดลองอักขระพิเศษก็พบว่ามันมีพฤติกรรมคล้าย GPT-4 อย่างมากเพราะมีปัญหากับอักระพิเศษเหมือนกัน
ผู้ใช้ที่ได้ลองใช้งานแล้วมีความเห็นต่างๆ กันไป บ้างก็ว่าไม่ต่างกันแชตบอตอื่นๆ แต่บางคนก็ระบุว่าดีกว่า GPT-4 ชัดเจน
การใช้งานสามารถเลือกได้ในเว็บ LMSYS ทั้งแบบ Direct และ Arena (side-by-side) แต่มีโควต้าการใช้งานชั่วโมงละ 1,000 แชตทำให้มักไม่ค่อยพอในช่วงนี้
OpenAI ไม่ได้เปิดตัวโมเดลใหม่มาระยะหนึ่งแล้ว โดยโมเดลสุดท้ายคือ GPT-4 Turbo ที่เปิดตัวมาแล้วครึ่งปี
OpenAI ประกาศว่าฟังก์ชัน Memory ใน ChatGPT ตอนนี้สามารถใช้งานได้แล้วสำหรับลูกค้าเสียเงิน ChatGPT Plus ทุกคน ยกเว้นในประเทศกลุ่มสหภาพยุโรป (EU) และเกาหลี ส่วนลูกค้าแบบ Team, Enterprise และ GPTs จะได้ใช้ Memory ในอนาคตเช่นกัน
Memory เป็นฟังก์ชันที่ OpenAI แบบจำกัดกลุ่มผู้ใช้งานก่อนหน้านี้ เป็นการสร้างข้อมูลพื้นฐานของผู้ใช้งานให้ ChatGPT จดจำไว้เลย ไม่ต้องอธิบายหรือทวนข้อมูลเหล่านี้ซ้ำในการสนทนาทุกครั้ง ซึ่ง ChatGPT จะเรียนรู้ทั้งจากการป้อนข้อมูลให้จดจำตรง ๆ หรือเรียนรู้ในระหว่างการสนทนา
Memory สามารถตรวจสอบและลบความจำบางหัวข้อ หรือตั้งค่าไม่ให้จดจำเลยก็ได้ โดยไปที่ Settings > Personalization > Memory
Financial Times (FT) ประกาศการเป็นพาร์ทเนอร์ทางยุทธศาสตร์กับ OpenAI อนุญาตให้ฝ่ายหลังนำเนื้อหาบน FT ไปเทรน ไปจนถึงนำไปใช้อ้างอิงในการตอบโต้ prompt ได้ ขณะที่ทาง FT เองก็เอาโมเดล OpenAI มาพัฒนาฟีเจอร์ด้าน AI ใหม่ๆ สำหรับผู้อ่านด้วย
ก่อนหน้านี้เมื่อปีที่แล้ว OpenAI ก็มีดีลคล้ายๆ กันกับ Associated Press (AP)
ที่มา - The Financial Times
Bloomberg รายงานว่า แอปเปิลกลับมาเจรจากับ OpenAI เพื่อนำโมเดลปัญญาประดิษฐ์มาใช้งานใน iOS 18 หลังเคยเจรจากันมารอบหนึ่งในช่วงต้นปีนี้แล้วล่มไป
ข่าวลือก่อนหน้านี้บอกว่า แอปเปิลเจรจากับทั้ง OpenAI และกูเกิล เรื่องการซื้อไลเซนส์โมเดลมาใช้งาน โดยการเจรจากับกูเกิลยังอยู่ในสถานะพูดคุยกัน แต่แอปเปิลก็ยังไม่ได้ตัดสินใจว่าจะเลือกรายใดเป็นพาร์ทเนอร์ และเป็นไปได้ว่าอาจเลือกทั้งคู่
Jensen Huang ซีอีโอ NVIDIA นำเซิร์ฟเวอร์ H200 ไปส่งให้ OpenAI ด้วยตัวเอง หลังจากที่เคยไปส่งเครื่อง DGX-1 ด้วยตัวเองตั้งแต่เมื่อตอนก่อตั้ง OpenAI เมื่อปี 2016
เซิร์ฟเวอร์ H200 เปิดตัวตั้งแต่ปลายปี 2023 และมีกำหนดส่งมอบไตรมาสที่สองของปี 2024 ซึ่ง Greg Brockman ระบุว่านี่เป็นเครื่องแรกของโลก
ที่มา - @gdb
OpenAI เปิดตัวฟีเจอร์เพิ่มเติม ด้วยคุณสมบัติสำหรับองค์กร (enterprise-grade) ให้กับลูกค้า API ซึ่งเป็นฟีเจอร์ด้านความปลอดภัย, ระบบ API ผู้ช่วย และเครื่องมือบริหารจัดการต้นทุนที่เกี่ยวข้อง
เครื่องมือด้านความปลอดภัยมาตรฐานองค์กร ได้แก่ Private Link สำหรับเชื่อมต่อ Azure กับ OpenAI, ระบบยืนยันตัวตนหลายขั้นตอน MFA และที่เพิ่มมาคือ ใบรับรอง SOC 2 Type II, SSO, การเข้ารหัส AES-256, การส่งผ่านข้อมูล TLS 1.2, การควบคุมการเข้าถึงแบบ role-based รวมทั้งสามารถรับรองมาตรฐาน HIPAA ให้กับลูกค้ากลุ่มสุขภาพ ที่ต้องรองรับมาตรฐานจัดเก็บข้อมูล
OpenAI ประกาศเพิ่มทางเลือกสำหรับนักพัฒนา โดยให้ส่วนลด 50% หากเลือกรันงานในช่วงเวลาที่โหลดของระบบไม่สูง (off-peak)
วิธีการดังกล่าวเรียกว่า Batch API นักพัฒนาสามารถอัปโหลดไฟล์หรือชุดคิวรีไปยังโมเดล AI เหมาะสำหรับงานที่ไม่ต้องการผลลัพธ์เพื่อใช้งานต่อทันที (async) เช่น ทำสรุปเนื้อหา, จำแนกข้อมูล หรือใส่ป้ายกำกับรูปภาพ โดย OpenAI บอกว่านักพัฒนาจะได้ผลลัพธ์ภายใน 24 ชั่วโมง หรือเร็วกว่านั้น เมื่อทรัพยากรมีเหลือพอให้รัน
Batch API นอกจากได้ส่วนลดแล้ว ยังให้อัตราจำกัดที่สูงกว่า เช่น 250M โทเค็น สำหรับ GPT-4T
ที่มา: The Verge
OpenAI ประกาศตั้งสำนักงานสาขาแห่งแรกในเอเชียที่เมืองโตเกียว ประเทศญี่ปุ่น ตามรายงานที่ออกมาก่อนหน้านี้ โดยพร้อมร่วมมือกับหน่วยงานรัฐ เอกชน และหน่วยงานวิจัยในประเทศ เพื่อพัฒนาเครื่องมือ AI ที่ปลอดภัย และรองรับความต้องการของญี่ปุ่นโดยเฉพาะ
Tadao Nagasaki จะรับตำแหน่งเป็นประธานของ OpenAI Japan ดูแลในด้านต่าง ๆ เช่น การตลาด การดำเนินงาน การสื่อสารองค์กร และส่วนอื่นสำหรับประเทศญี่ปุ่น
OpenAI ประกาศนำโมเดล GPT-4 Turbo มาให้ใช้งานแล้วสำหรับลูกค้า ChatGPT ที่เสียเงิน
GPT-4 Turbo นั้นเปิดตัวมาตั้งแต่พฤศจิกายนปีที่แล้ว มีการปรับปรุงความสามารถเช่น การเขียน, คณิตศาสตร์, การให้เหตุผลแบบตรรกะ และการเขียนโค้ด
ทั้งนี้ไมโครซอฟท์ได้นำ GPT-4 Turbo มาให้ใช้งานบน Copilot สำหรับลูกค้าฟรีเมื่อเดือนที่แล้ว
ที่มา: Engadget
New York Times อ้างแหล่งข่าวไม่เปิดเผยตัว 3 คน ระบุว่า OpenAI ดูดวิดีโอ YouTube มากกว่าล้านชั่วโมงเพื่อไปฝึก GPT-4 แม้ว่าทีมงานภายในจะมีความกังวลว่าการทำเช่นนี้จะเป็นการละเมิดข้อตกลงการใช้งานของ YouTube
ที่ผ่านมาผู้พัฒนาปัญญาประดิษฐ์ในกลุ่ม LLM ต้องการข้อความจำนวนมากเพื่อมาฝึกปัญญาประดิษฐ์ และที่สำคัญข้อความเหล่านั้นต้องเป็นคอนเทนต์คุณภาพสูงเชื่อถือได้ เพื่อฝึกปัญญาประดิษฐ์ให้ตอบเฉพาะข้อมูลที่ถูกต้อง ทาง OpenAI เองก็มีโครงการซื้อคอนเทนต์เหล่านี้อยู่ โดยมีข่าวหลุดออกมาว่าราคาประมาณ 1-5 ล้านดอลลาร์ต่อปี
OpenAI ประกาศเพิ่มความสามารถ Fine-tuning หรือการปรับแต่งแชทบอต AI ให้ได้ผลลัพธ์เข้ากับบริบทที่ต้องการใช้งาน โดยเฉพาะสำหรับลูกค้าองค์กร โดยตอนนี้ขยายมารองรับ API ของ GPT-4 แล้ว จากก่อนหน้านี้มีรองรับถึง GPT-3.5 Turbo
ตัวอย่างการปรับแต่งผลลัพธ์ที่นำไปใช้งานจริง เช่น SK Telecom บริษัทโทรคมนาคมรายใหญ่ในเกาหลีใต้ ได้ใช้ Fine-tuning บน GPT-4 ทำให้ได้แชทบอตที่รองรับการสนทนาบริการลูกค้า ในหัวข้อที่เกี่ยวกับบริการโทรคมนาคมเท่านั้น และใช้งานในภาษาเกาหลีได้ เพิ่มความแม่นยำมากขึ้น 33% และคะแนนความพึงพอใจลูกค้าเพิ่มจาก 3.6 เป็น 4.5 (เต็ม 5)
ก่อนหน้านี้มีรายงานว่า Jony Ive อดีตหัวหน้าฝ่ายออกแบบผลิตภัณฑ์แอปเปิล ซึ่งปัจจุบันเขาเป็นเจ้าของบริษัทออกแบบ LoveForm ได้หารือความร่วมมือกับ OpenAI เพื่อพัฒนาอุปกรณ์ AI ตัวใหม่ โดยยังไม่มีรายละเอียดว่าอุปกรณ์นี้จะเป็นอย่างไร และความคืบหน้าการหารือไปถึงขั้นใด
ล่าสุด The Information มีรายงานเพิ่มเติมถึงโครงการดังกล่าว บอกว่า Jony Ive และ OpenAI ได้เจรจาขอรับเงินทุนแล้วจาก Thrive Capital และ Emerson Collective ซึ่งตามรายงานก่อนหน้านี้ Ive ต้องการเงินทุนประมาณ 1 พันล้านดอลลาร์
ก่อนหน้านี้ Mira Murati ซีทีโอ OpenAI ให้สัมภาษณ์กับ The Wall Street Journal เกี่ยวกับ AI สร้างวิดีโอ Sora ซึ่งนักข่าวถามคำถามหนึ่งว่า Sora ใช้วิดีโอจากแหล่งใดมาเทรน Murati บอกว่าเป็นวิดีโอสาธารณะจากแหล่งต่าง ๆ และวิดีโอที่ซื้อไลเซนส์ ซึ่งเมื่อถามต่อไปว่าเป็นวิดีโอใน YouTube ด้วยหรือไม่ Murati ปฏิเสธที่จะตอบและบอกว่าไม่ทราบ
คำตอบนี้ถูกนำมาเป็นประเด็นอีกครั้ง เมื่อ Neal Mohan ซีอีโอ YouTube ให้สัมภาษณ์พิเศษกับ Bloomberg ซึ่งนักข่าวก็ถามว่า เขาทราบหรือไม่ว่า OpenAI ได้ใช้วิดีโอบน YouTube มาเทรน AI Sora หรือไม่?