Large Language Model
ทีมวิจัยจาก Hugging Face ประกาศโครงการ Open-R1 พยายามฝึกโมเดลใหม่ที่เทียบเท่ากับ DeepSeek-R1 แต่มีชุดข้อมูลเปิดให้คนอื่นไปทำซ้ำได้
หลักการของ DeepSeek-R1 ในแกนกลางนั้นตรงไปตรงมา คือผู้ฝึกมีชุดข้อมูลการให้เหตุผลในการแก้ปัญหาไว้ล่วงหน้า จากนั้นพยายามฝึกโมเดล LLM ปกติสักตัว โดยให้รางวัลการให้เหตุผลแบบ reinforcement learning (RL) แบบเดียวกับการให้รางวัล AI เล่นเกมที่ให้รางวัลเมื่อเล่นชนะ
แม้ DeepSeek-R1 จะเปิดโค้ดสำหรับรันโมเดล แต่ก็ไม่ได้เปิดเผยชุดข้อมูลเอาไว้ รวมถึงไม่ได้เปิดโค้ดสำหรับการฝึกโมเดล การศึกษาโมเดลจึงทำได้เฉพาะในแง่การใช้งานเท่านั้น การสร้างชุดข้อมูลเปิดพร้อมกับโค้ดฝึกให้ทุกคนใช้งานจะเปิดให้มีการพัฒนาโมเดลแบบนี้กว้างขึ้นมาก
DeepSeek กลายเป็นกระแสมาแรงในนาทีนี้ของโลกปัญญาประดิษฐ์ ทำให้ใครก็อยากทดลองใช้งานเพื่อเปรียบเทียบกับเครื่องมือ AI ที่ใช้ประจำ ซึ่งทำให้ DeepSeek ต้องประกาศจำกัดการลงทะเบียนสร้างบัญชีใช้งานในช่วงนี้
ก่อนหน้านี้ DeepSeek ขึ้นข้อความในหน้าสมัครใช้งานว่าระงับชั่วคราว เนื่องจากแพลตฟอร์มถูกรบกวนจากการโจมตีขนาดใหญ่ ในบางช่วงการลงทะเบียนต้องใช้เบอร์โทรศัพท์ในจีนเท่านั้น แต่ล่าสุดข้อความบอกว่าการโจมตียังมีอยู่ ระบบลงทะเบียนอาจใช้งานไม่ได้ในบางช่วง ให้ผู้สนใจรอและทดลองสมัครอีกครั้ง ส่วนคนที่มีบัญชีอยู่แล้วสามารถล็อกอินได้ตามปกติ ขอบพระคุณที่เข้าใจและให้การสนับสนุน
DeepSeek เปิดตัวโมเดล AI รองรับสื่อผสมผสานหรือ Multimodal ชื่อว่า Janus-Pro มีขนาดพารามิเตอร์ 1B และ 7B พร้อมความสามารถในการวิเคราะห์และสร้างรูปภาพขึ้นใหม่ตามที่กำหนดได้
ผลการทดสอบด้วยชุดทดสอบ GenEval และ DPG-Bench พบว่า Janus-Pro-7B ทำคะแนนได้สูงกว่า DALL-E 3 ของ OpenAI ตลอดจนโมเดลสร้างรูปภาพอื่นอย่าง PixArt-alpha, Emu3-Gen และ Stable Diffusion XL ของ Stability AI
โมเดลสามารถดาวน์โหลดได้ที่ GitHub ภายใต้เงื่อนไขใช้งาน MIT จึงสามารถใช้งานในเชิงพาณิชย์ได้
ที่มา: TechCrunch
Alibaba เปิดตัวโมเดลปัญญาประดิษฐ์ใหม่ในตระกูล Qwen2.5 ชื่อว่า Qwen2.5-VL โดย VL ย่อมาจาก Vision Language เป็นรุ่นถัดจาก Qwen2-VL มีความสามารถเข้าใจวิดีโอ รูปภาพ ข้อความ และเป็น Agentic ที่ทำงานแทนได้ด้วย
ตัวอย่างความสามารถที่พิเศษขึ้นของ Qwen2.5-VL เช่น การรู้จักภาพสถานที่ ฉากภาพยนตร์ รายการทีวี สินค้า, สามารถระบุลักษณะวัตถุในภาพตามเงื่อนไข และส่งออกเป็นไฟล์ JSON ได้, ระบุตัวอักษรที่หลากหลายแบบในภาพเดียวได้, สามารถส่งออกไฟล์เอกสารออกมาเป็นฟอร์แมตที่ต้องการได้, สามารถดึงข้อมูลจากวิดีโอออกมาได้ และทำหน้าที่เป็น Agent รันบนคอมพิวเตอร์หรือสมาร์ทโฟนได้
NVIDIA ชี้แจงกับสื่อหลังราคาหุ้นปรับลดลงแรง 17% จากความกังวลว่า DeepSeek ได้นำเสนอเทคโนโลยีการพัฒนาปัญญาประดิษฐ์ที่ไม่ต้องพึ่งพาฮาร์ดแวร์ประสิทธิภาพสูง จึงอาจเข้าสู่จุดพีคของความต้องการจีพียู
NVIDIA บอกว่าเทคโนโลยี DeepSeek ทำให้เห็นว่าเราสามารถสร้างโมเดลใหม่ขึ้นมาได้ โดยใช้เทคนิคหลายอย่าง รวมทั้งต่อยอดจากโมเดลโอเพนซอร์สที่มีอยู่ ร่วมกับการประมวลผลที่ถูกควบคุมไว้อย่างดี ซึ่งเป็นความก้าวหน้าในการทำส่วน Test-Time Scaling ตามกฎการ Scaling 3 อย่าง (Three Scaling Laws) ที่ซีอีโอ Jensen Huang เคยอธิบายไว้
The Information อ้างแหล่งข่าวภายใน Meta บอกว่าได้มีการเรียกประชุมหัวหน้าและวิศวกร ส่วนที่ดูแล Generative AI และ Infrastructure เป็นการเร่งด่วน โดยตั้งวอร์รูม (War Room) เป็น 4 ทีม เพื่อประเมินการทำงานและผลกระทบที่เกิดขึ้นจาก DeepSeek
โดยมี 2 ทีม โฟกัสที่การทำงานของ DeepSeek ว่าใช้วิธีอย่างไรทำให้ต้นทุนการฝึกฝนต่ำมาก รวมทั้งใช้ทรัพยากรน้อยในการรันโมเดล อีกทีมทำการศึกษาว่า DeepSeek ใช้ข้อมูลจากแหล่งใดในการฝึกฝน AI และทีมสุดท้ายพิจารณาว่า Meta สามารถนำวิธีการใหม่ ๆ จาก DeepSeek มาปรับใช้ในการพัฒนาโมเดลของบริษัทอย่างไรได้บ้าง
OpenAI ประกาศเพิ่มฟีเจอร์ใหม่ให้อินเทอร์เฟซ ChatGPT Canvas ซึ่งเหมาะสำหรับการใช้งานเขียนโค้ดหรือปรับปรุงการเขียนบทความ รายละเอียดดังนี้
DeepSeek บริษัทปัญญาประดิษฐ์ของจีนที่เพิ่งเปิดตัวโมเดลคิดเป็นขั้นตอน R1 เมื่อสัปดาห์ที่แล้ว กลายเป็นหัวข้อสนทนาหลักในวงการ AI ถึงความก้าวหน้าครั้งใหญ่ เพราะโมเดลมีขนาดเล็กที่สุด 1.5B แต่ความสามารถหลายด้านสูงกว่า OpenAI o1-mini ขณะที่ต้นทุนในการฝึกฝนโมเดลนั้นต่ำมาก โดยบริษัทบอกว่าใช้เงิน 5.6 ล้านดอลลาร์เท่านั้น
กระแสข่าวที่ออกมาทำให้ DeepSeek ตอนนี้ขึ้นอันดับ 1 แอปยอดนิยมของ App Store ในสหรัฐอเมริกา แซงหน้า ChatGPT ไปเรียบร้อย
Anthropic เปิดตัวความสามารถใหม่สำหรับ API ของนักพัฒนาเรียกชื่อว่า Citations เพื่อให้คำตอบที่ได้ สามารถตรวจสอบย้อนกลับไปต้นทางได้ว่ามีที่มาอย่างไร เพิ่มความน่าเชื่อถือและลดความผิดเพี้ยน
ในการใช้งาน Citations ผู้ใช้งานจะอัปโหลดเอกสารอ้างอิง จากนั้นโมเดล Claude จะแยกประโยคเป็นส่วน ๆ เพื่อให้ถูกลิงก์กลับมาเมื่อมีการให้คำตอบในประเด็นนั้น ผลการทดสอบภายในของ Anthropic พบว่าการอ้างอิงทำให้คำตอบมีความแม่นยำมากขึ้น 15%
ByteDance เปิดตัว Doubao-1.5-pro โมเดลปัญญาประดิษฐ์ LLM เรือธงของบริษัท โดยระบุว่าผลการทดสอบในบางหัวข้อ เช่น ความรู้ MMLU, โค้ด McEval หรือการให้เหตุผล DROP ทำได้เหนือกว่าโมเดลรุ่นบนของค่ายอื่นทั้ง Llama3.1-405B หรือ GPT4o-0806
การเปิดตัวโมเดลปัญญาประดิษฐ์รุ่นใหม่ของ ByteDance นี้ ทำให้เห็นถึงการแข่งขันด้าน AI จากบริษัทจีน โดยเมื่อต้นสัปดาห์ DeepSeek ก็เปิดตัว DeepSeek-R1 ซึ่งทำงานด้วยการคิดเป็นขั้นตอน และมีผลทดสอบบางชุดดีกว่า o1 ของ OpenAI
DeepSeek บริษัทปัญญาประดิษฐ์จากจีนเปิดตัวโมเดล DeepSeek-R1 โมเดล LLM แบบคิดหาเหตุผลก่อนตอบ (reasoning model) โดยแบ่งเป็นสองรุ่นย่อย คือ
Sam Altman ซีอีโอ OpenAI เปิดเผยว่าบริษัทได้เข้าสู่การพัฒนาเวอร์ชันสุดท้ายของโมเดลคิดเป็นเหตุเป็นผล o3-mini แล้ว ซึ่งจะปล่อยออกมาให้ใช้งานในอีกไม่กี่สัปดาห์ข้างหน้า
OpenAI เปิดตัวโมเดลใหม่ o3 และ o3-mini เมื่อเดือนธันวาคมปีที่แล้ว มีความสามารถทำข้อสอบ ARC-AGI ที่ต้องใช้ความเข้าใจกฎของแต่ละข้อได้คะแนนสูงกว่ามนุษย์ทั่วไป ซึ่งตอนนั้น OpenAI บอกว่าทั้งสองโมเดลยังอยู่ในขั้นตอนการทดสอบความปลอดภัย คาดว่า o3-mini จะเผยแพร่ออกมาได้ก่อน
Altman บอกว่าทั้ง API และการทำงานบน ChatGPT จะรองรับพร้อมกันกับการเผยแพร่โมเดล o3-mini นี้ด้วย
Cerebras ผู้ผลิตชิปปัญญาประดิษฐ์รัน LLM ความเร็วสูงที่สามารถรัน Llama 3.1 405B ได้ความเร็วถึง 969 token/s เปิดเผยถึงแนวทางการออกแบบชิปที่ทำให้สามารถให้บริการได้เร็วระดับนี้ ว่าอาศัยการสร้างชิปขนาดใหญ่ที่มีคอร์จำนวนมหาศาลอยู่ภายใน
แอปเปิลได้ออกอัปเดต iOS 18.3 เบต้า 3 ซึ่งเป็นเวอร์ชันทดสอบให้กับนักพัฒนา โดยมีการเปลี่ยนแปลงสำคัญของ Apple Intelligence ส่วนปัญญาประดิษฐ์สรุปข้อความแจ้งเตือนหรือ Notification Summary
ก่อนหน้านี้ฟังก์ชัน Notification Summary ถูกรายงานปัญหาการสรุปข้อความที่ผิดเพี้ยนไปจากสาระสำคัญ โดยสำนักข่าว BBC ยกตัวอย่างหลายกรณี ทำให้แอปเปิลออกมายอมรับในความผิดพลาดและบอกว่าจะแก้ไข
แอปเปิลอธิบายรายละเอียดที่ปรับปรุงใน iOS 18.3 ดังนี้
Together.AI บริการคลาวด์ LLM เปิด Llama 3.3 70B ให้ใช้งานได้ฟรีในระดับ free tier ที่จำกัดปริมาณการใช้งาน
โมเดลนี้รันบน Together Turbo และใช้โมเดลแบบ FB8 ที่ยังคงความเร็วโดยไม่เสียคุณภาพมากนัก (โมเดลเดิมพารามิเตอร์เป็น BF16)
ผู้ใช้งานฟรีจะมี rate limit ที่ 60RPM และ 60,000 TPM (token per minute) การใช้งานแชตทั่วไปน่าจะเพียงพอ แต่หากเป็นการใช้งานเอกสารขนาดใหญ่ หรือต้องการทำบริการ agentic ที่พรอมพ์มักจะยาวมากๆ ก็น่าจะต้องระวังเกินโควต้า
ที่มา - Together.AI
Red Hat รายงานว่าบริษัทได้ซื้อกิจการ Neural Magic สตาร์ทอัปด้าน AI เสร็จสิ้นแล้ว หลังจากบริษัทประกาศแผนซื้อกิจการเมื่อเดือนพฤศจิกายนปีที่แล้ว ดีลนี้ไม่มีการเปิดเผยมูลค่า โดยก่อนหน้านี้ Neural Magic ได้รับเงินจากนักลงทุนรวม 50 ล้านดอลลาร์ และดีลนี้อาจเรียกว่าคนคุ้นเคยก็ได้ เพราะซีอีโอ Neural Magic คือ Brian Stevens อดีตผู้บริหาร Red Hat
Neural Magic เป็นบริษัทพัฒนาซอฟต์แวร์ซึ่งอยู่บนแนวคิดว่า อนาคตของปัญญาประดิษฐ์ต้องเป็นแบบเปิด โมเดลจึงควรสามารถเข้าถึงได้ในทุกระดับ และประมวลผลได้บนฮาร์ดแวร์ที่หลากหลาย ซอฟต์แวร์ของ Neural Magic มีความสามารถปรับแต่งให้โมเดลปัญญาประดิษฐ์ที่ซับซ้อน ก็สามารถทำงานได้บนฮาร์ดแวร์ที่ไม่ได้มีสเป็กสูง
Alibaba Cloud เปิดบริการ Qwen Chat แบบเดียวกับ ChatGPT ให้ลูกค้าบุคคลทั่วไปใช้งาน จากเดิม Qwen เปิดให้บริการ API บน Alibaba Cloud สำหรับลูกค้าองค์กรเป็นหลัก
Qwen Chat ให้บริการทั้งโมเดล Qwen เวอร์ชั่นโอเพนซอร์สและเวอร์ชั่นปิดที่เคยต้องเรียกผ่าน API เท่านั้น รวมถึงโมเดลแบบคิดก่อนตอบอย่าง QwQ และ QVQ ด้วย
หน้าจอใช้ OpenWebUI แบบเดียวกับที่จุฬาลงกรณ์มหาวิทยาลัยใช้งาน ทำให้มีฟีเจอร์ตามมาหลายตัว เช่น การเปรียบเทียบโมเดลรุ่นต่างๆ ตอนนี้ยังไม่มีเงื่อนไขค่าบริการแต่อย่างใด
ที่มา - @Alibaba_Qwen
กูเกิลยังคงเพิ่มฟีเจอร์คอนเทนต์เสียงที่สร้างด้วย AI ให้กับผู้ใช้งาน โดยล่าสุดเพิ่มโครงการทดลอง "Daily Listen" ที่นำเนื้อหาในฟีดข่าวมาแปลงเป็นรายการพอดคาสต์สรุปเนื้อหาให้
ไอเดียนี้เป็นการพัฒนาจากฟีเจอร์ที่เป็นกระแสก่อนหน้านี้ NotebookLM ที่สร้างรายการเสียงพอดคาสต์ขึ้นจากไฟล์เอกสาร
รายการ Daily Listen ที่สรุปเนื้อหาข่าวในฟีดผู้ใช้งานแต่ละคน ถูกสร้างด้วยความยาวประมาณ 5 นาที แสดงเป็นไอคอนในหน้าแรกของแอป Google ให้กดฟัง
ฟีเจอร์นี้ยังจำกัดให้เฉพาะผู้ใช้งานในสหรัฐอเมริกา ใช้งานได้ผ่านแอป Google ทั้ง Android และ iOS โดยต้องเปิดการทำงานใน Labs ที่มุมบนซ้ายของแอปก่อน
ไมโครซอฟท์โอเพนซอร์สโมเดลปัญญาประดิษฐ์ Phi-4 ผ่าน Hugging Face แล้ว ตามที่เคยประกาศไว้ ภายใต้สัญญาอนุญาตแบบ MIT
ไมโครซอฟท์เปิดตัว Phi-4 ที่เป็นโมเดลภาษาขนาดเล็ก (Small Language Model) 14B พารามิเตอร์ เมื่อเดือนที่แล้ว โดยจำกัดให้ใช้งานผ่าน Azure AI Foundry การโอเพนซอร์สโมเดลนี้พร้อมสัญญาอนุญาตแบบ MIT ที่สามารถนำไปใช้งานต่อในเชิงพาณิชย์ได้ น่าจะเพิ่มทางเลือกให้กับพัฒนาได้
Phi-4 มีผลทดสอบที่โดดเด่น โดยเฉพาะการแก้ปัญหาคณิตศาสตร์ หรือหัวข้อเฉพาะทาง รวมทั้งมีคะแนนที่สูงกว่าโมเดลขนาดใหญ่กว่าอย่าง Gemini Pro 1.5 ในบางหัวข้อด้วย
ตำรวจลาสเวกัสแถลงข่าวผลการสอบสวน เหตุการณ์ที่คนร้ายวางระเบิดรถกระบะไฟฟ้า Tesla Cybertruck หน้าโรงแรม Trump Hotel ซึ่งคนร้ายที่เป็นคนขับรถเสียชีวิต และมีผู้บาดเจ็บอีกหลายคน โดยบอกว่าคนร้ายใช้ ChatGPT ช่วยวางแผนก่อเหตุครั้งนี้
แอปเปิลออกแถลงการณ์ชี้แจงสำนักข่าว BBC เกี่ยวกับฟีเจอร์สรุปข้อความในการแจ้งเตือน Notification Summary ของ Apple Intelligence ที่สรุปเนื้อหาผิดพลาดไม่ตรงกับเนื้อหาจริง
แอปเปิลเพิ่มปัญญาประดิษฐ์ Apple Intelligence มาตั้งแต่ iOS 18.1 ซึ่งหนึ่งในความสามารถที่มีคือการสรุปข้อความแจ้งเตือนหรือ Notification Summary เพื่อลดเวลาที่ผู้ใช้งานต้องไล่อ่านทุกข้อความเตือน รวบสรุปไว้ในบรรทัดเดียว ซึ่งแอปที่แอปเปิลยกตัวอย่างว่ามีประโยชน์สำหรับฟังก์ชันนี้เช่น Messages หรือแอปข่าวต่าง ๆ นั่นเอง
NVIDIA เปิดตัวคอมพิวเตอร์ Project DIGITS ที่ภายในเป็นชิป GB10 Superchip สถาปัตยกรรม Grace Blackwell ชูจุดขายว่าเราทุกคนสามารถรันโมเดลขนาด 200B ด้วยตัวเอง
GB10 เป็นซีพียู NVIDIA Grace 20 คอร์ แรม 128GB รวมกันระหว่างซีพียูและจีพียู สตอเรจ NVMe 4TB ทำให้หากรันโมเดลย่อแบบ FP4 ก็จะรันโมเดลขนาดใหญ่ 200B ได้ในตัว แถมรองรับเน็ตเวิร์ค ConnectX เชื่อม DIGITS สองตัวเข้าด้วยกัน รันโมเดล 405B ได้
Project DIGITS เริ่มวางขายเดือนพฤษภาคมนี้ ราคาเริ่มต้น 3,000 ดอลลาร์หรือประมาณหนึ่งแสนบาท
ที่มา - NVIDIA
Anthropic เปิดเผยว่าโมเดล AI Claude จะหยุดให้ข้อมูลเนื้อเพลง ที่มีลิขสิทธิ์ของค่ายเพลง หรือสร้างเนื้อเพลงใหม่ที่อิงจากเพลงที่มีลิขสิทธิ์ หลังจากสามค่ายเพลงใหญ่ฟ้อง Anthropic ที่นำเนื้อเพลงลิขสิทธิ์ไปเทรน AI อย่างไรก็ตามคดีความที่ยังฟ้องร้องกันนั้นยังคงดำเนินต่อไป
ในแถลงการณ์ Anthropic บอกว่าบริษัทไม่ได้สร้าง Claude ให้ละเมิดลิขสิทธิ์ ในการพัฒนามีขั้นตอนหลายอย่างเพื่อป้องกันอยู่แล้ว การตัดสินใจหยุดให้ข้อมูลนี้ก็เพื่อแสดงให้เห็นว่าบริษัทให้ความสำคัญกับเรื่องเนื้อหาที่อาจละเมิดลิขสิทธิ์
SCB10X ประกาศปล่อยโมเดลปัญญาประดิษฐ์ LLM โดยรองรับหลายรูปแบบทั้งแบบขัอความปกติ, แบบรับภาพ, และแบบรับ/ตอบเป็นเสียง
ตัวโมเดลทั้งหมดพัฒนาต่อมาจากโมเดลโอเพนซอร์ส Llama-3.1/3.2, Qwen2.5 พร้อมกับโมเดลความปลอดภัย Typhoon2-Safety ที่พัฒนามาจาก mdeberta-v3-base โดยจุดสำคัญคือการสร้างชุดข้อมูลที่สะท้อนวัฒนธรรมไทย ทีมงานสร้างโมเดลปัญญาประดิษฐ์มาจัดคะแนนข้อมูลว่าเกี่ยวข้องกับประเทศไทยหรือไม่ โดยให้คะแนน 1-5 ชุดข้อมูลที่ได้คะแนนเกินเกณฑ์ในหมวดต่างๆ ก็จะถูกนำมาใช้งาน ข้อมูลอีกส่วนหนึ่งยังเป็นการสร้างจาก LLM ที่อ่านข้อความแล้วเขียนเป็นภาษาไทยในสไตล์ หนังสือเรียน, บล็อก, หรือบทความวิชาการ
Alibaba Cloud ประกาศลดราคาค่าใช้งานโมเดลปัญญาประดิษฐ์ที่รับอินพุทเป็นรูปภาพและวิดีโอ Qwen-vl-max ลง 85% โดยราคาอยู่ที่ 0.003 หยวนต่อ 1,000 อินพุทโทเค็น
การลดราคานี้เพื่อให้โมเดลทำความเข้าใจรูปภาพของ Alibaba Cloud สามารถแข่งขันด้านราคากับโมเดลประเภทเดียวกันของ ByteDance ได้ ซึ่งคิดราคาที่ 0.003 หยวน เท่ากัน
ประกาศนี้สะท้อนว่าการแข่งขันเรื่องโมเดลปัญญาประดิษฐ์ของผู้ให้บริการในจีนมีเพิ่มมากขึ้น ปัจจุบันการให้บริการโมเดลปัญญาประดิษฐ์ในจีน ต้องได้รับการอนุมัติจากหน่วยงานก่อน ซึ่งตอนนี้มีโมเดล Generative AI ที่ถูกอนุมัติแล้ว 252 โมเดล ผู้ให้บริการจึงเริ่มใช้การลดราคา มาดึงดูดให้เกิดการเลือกใช้งาน