Large Language Model

Tags:
Node Thumbnail

กูเกิลเปิดตัวโมเดลแต่งเพลงชื่อ Lyria สามารถสั่งสร้างเพลงได้จากพร็อมต์ข้อความได้เลย ตัวโมเดลจะเปิดใช้งานบน Vertex AI ในระยะถัดไป

ในแง่ความสามารถของ Lyria คงไม่ต่างจากโมเดลแต่งเพลงอื่นๆ นัก (คงต้องให้ผู้เชี่ยวชาญลองพิสูจน์กัน) แต่จุดขายของกูเกิลคือมีโมเดลสร้างสื่อครบทุกอย่างแล้ว ตั้งแต่ Gemini (ข้อความ), Imagen 3 (ภาพ), Veo 2 (วิดีโอ), Chirp 3 (เสียงพูด) และล่าสุดคือ Lyria (เสียงเพลง)

Tags:
Node Thumbnail

ผู้บริหารของกูเกิลได้แก่ Sundar Pichai ซีอีโอใหญ่ และ Demis Hassabis ซีอีโอของ Google DeepMind ประกาศว่ากูเกิลจะรองรับ Model Context Protocol (MCP) โปรโตคอลสำหรับเชื่อมแหล่งข้อมูลภายนอกเข้าสู่โมเดล LLM

Model Context Protocol (MCP) ถูกเสนอโดย Anthropic ช่วงปลายปี 2024 และล่าสุด OpenAI ประกาศสนับสนุนแล้ว การที่กูเกิลประกาศร่วมด้วยอีกราย ย่อมทำให้ MCP กลายเป็นมาตรฐานของวงการ

Tags:
Node Thumbnail

OpenAI ประกาศแผนยุติการใช้งานโมเดล GPT-4 จากบริการ ChatGPT ทั้งหมด มีผลตั้งแต่ 30 เมษายน 2025 เป็นต้นไป โดยแทนที่ด้วยโมเดล GPT-4o ทั้งนี้ GPT-4 เป็นโมเดลที่ออกมาตั้งแต่เมษายน 2023

OpenAI บอกว่า GPT-4o เป็นโมเดลที่ใหม่กว่า รองรับข้อมูลผสมผสานเป็นพื้นฐาน ในการทดสอบทุกด้านมีความสามารถที่สูงกว่า GPT-4 ไม่ว่าจะเป็นการเขียน, เขียนโค้ด, ตอบปัญหา STEM และอื่น ๆ

GPT-4 จะยังสามารถเข้าถึงได้สำหรับนักวิจัยและนักพัฒนาผ่าน API เท่านั้น ซึ่งเป็นช่องทางเดียวกับการเข้าถึงโมเดลเก่ากว่านั้นเช่น GPT-3.5

Tags:
Node Thumbnail

กูเกิลโอเพนซอร์สเฟรมเวิร์ค Agent Development Kit (ADK) สำหรับการพัฒนา Agent ในรูปแบบต่างๆ โดยแม้จะพัฒนาโดยกูเกิลแต่ก็รองรับโมเดลจากผู้ผลิตหลากหลาย และเชื่อมต่อเครื่องมือภายนอกผ่านโปรโตคอล MCP ได้

ความพิเศษของ ADK ต่อกูเกิลเองคือ Vertex AI รองรับโดยตรงผ่าน Vertex AI Agent Engine อย่างไรก็ดี ตัว ADK นั้นแพ็กเกจเป็นคอนเทนเนอร์ทำให้ไปรันที่ไหนก็ได้อยู่แล้ว และกูเกิลระบุว่า ADK ออปติไมซ์ให้ทำงานกับ Gemini 2.5 Pro เป็นพิเศษ

Tags:
Node Thumbnail

เพียงไม่กี่สัปดาห์หลัง Gemini 2.5 Pro รุ่นใหญ่ กูเกิลเดินหน้าเปิดตัว Gemini 2.5 Flash โมเดลรุ่นเล็กต่อทันที

กูเกิลเรียกโมเดล Gemini 2.5 Flash ว่าเป็นโมเดลที่ใช้ทำงานจริงๆ (workhorse model) ปรับแต่งมาให้ตอบเร็ว (low latency) ต้นทุนต่ำ แต่ยังมีฟีเจอร์การให้เหตุผล (reasoning) โดยสามารถปรับแต่งระยะเวลาในการคิดตามงบประมาณ (thinking budget) จึงเหมาะสำหรับงานที่ต้องเรียกโมเดลเป็นจำนวนครั้งมากๆ และต้องการความเร็วแบบเรียลไทม์ เช่น การตอบคำถามลูกค้า หรือ การประมวลผลเอกสาร

ตอนนี้กูเกิลยังไม่ประกาศราคาของ Gemini 2.5 Flash ออกมา รวมถึงคะแนนเบนช์มาร์คของ 2.5 Flash ด้วย

Tags:
Node Thumbnail

Amazon ยังเดินหน้าเปิดตัวโมเดลตระกูล Nova อย่างต่อเนื่อง ถัดจาก Nova Reel โมเดลสร้างวิดีโอ ตามมาด้วย Nova Sonic โมเดลสร้างคำตอบเสียง ที่เป็นโมเดลตัวเดียวทำงานทั้งการเข้าใจเสียงพูด (speech understanding) และสร้างเสียงพูด (speech generation) ไม่ต้องแยกสองโมเดลทำงานอีกต่อไป

ความน่าสนใจของ Nova Sonic คือเป็นโมเดลแบบเสียง-เสียง (speech-to-speech) รับอินพุตเป็นเสียงพูด แล้วสร้างเอาต์พุตเป็นข้อความหรือเป็นเสียงก็ได้ สามารถทำงานแบบเรียลไทม์

Tags:
Node Thumbnail

หลัง Amazon เปิดตัวโมเดลตระกูล Nova ของตัวเองช่วงปลายปี 2024 ก็เริ่มทยอยปล่อยของอย่างต่อเนื่อง ก่อนหน้านี้มี Nova Act โมเดลที่ควบคุมเว็บเบราว์เซอร์ ล่าสุดเปิดตัว Nova Reel ปัญญาประดิษฐ์สร้างวิดีโอสั้นเวอร์ชันใหม่ 1.1

Nova Reel 1.1 ขยายเวลาของวิดีโอจากเดิม 6 วินาทีในเวอร์ชัน 1.0 มาเป็น 2 นาที (เป็นการสร้างวิดีโอ 6 วินาทีแบบ multiple-shot ต่อๆ กัน แต่สั่งได้จากพร็อมต์ครั้งเดียว) รองรับการสร้างคาแรกเตอร์สูงสุด 4,000 ตัว รวมถึงสามารถใส่ภาพอ้างอิงให้สร้างคาแรกเตอร์หรือซีนตามที่สั่งได้ด้วย

ตอนนี้ Nova Reel 1.1 เปิดให้ใช้งานแล้วบน Amazon Bedrock

Tags:
Node Thumbnail

Tobi Lütke ซีอีโอ Shopify ออกจดหมายเวียนในบริษัท ปรับนโยบายการทำงานในอนาคต โดยระบุนโยบาย 6 ข้อ ได้แก่

Tags:
Node Thumbnail

ไมโครซอฟท์ร่วมมือกับ Meta เปิดให้องค์กรธุรกิจใช้งาน Llama 4 Maverick และ Scout ใน Azure AI Foundry และ Azure Databricks แล้ว

Llama 4 เป็นโมเดล AI โอเพนซอร์สรุ่นใหม่สำหรับการใช้งานแบบ Multimodal ซึ่ง Meta เพิ่งประกาศเปิดตัววันนี้

Tags:
Node Thumbnail

Meta ออกโมเดลปัญญาประดิษฐ์ภาษาขนาดใหญ่ (LLM) รุ่นใหม่ Llama 4 ซึ่ง Mark Zuckerberg ซีอีโอ Meta บอกว่าเป็นโมเดล AI พื้นฐานที่มีประสิทธิภาพสูงที่สุดในโลกตอนนี้

Llama 4 มีสองรุ่นย่อย ได้แก่ Llama 4 Scout ขนาดพารามิเตอร์ 17B, 16 โมเดลย่อย (Experts) รวม 109B ซึ่ง Meta บอกว่าเป็นโมเดลผสมผสานที่มีประสิทธิภาพดีที่สุดในโลกตอนนี้ สามารถรันได้บนจีพียู NVIDIA H100 ตัวเดียว รองรับอินพุท 10M ทำงานได้ดีกว่าโมเดลที่คล้ายกันอย่าง Gemma 3, Gemini 2.0 Flash-Lite และ Mistral 3.1

Tags:
Node Thumbnail

กูเกิลเปิดตัว Gemini 2.5 Pro โมเดลพลังสูง ประสิทธิภาพเป็นเยี่ยม เมื่อปลายเดือนมีนาคม จากนั้นมีแหวกขนบเดิมๆ เล็กน้อย ด้วยการเปิดให้ผู้ใช้ Gemini ทุกคนใช้ฟรี โดยไม่ต้องรอกันนาน

ล่าสุดกูเกิลนำโมเดล Gemini 2.5 Pro เปิดให้เช่าใช้งานใน Google AI Studio โดยประกาศราคามาแล้ว ราคาเริ่มต้นคือ อินพุต 1.25 ดอลลาร์ต่อ 1 ล้านโทเคน และเอาท์พุต 10 ดอลลาร์ต่อ 1 ล้านโทเคน

Tags:
Node Thumbnail

Sam Altman ซีอีโอ OpenAI ประกาศว่าบริษัทเปลี่ยนแผนการออกโมเดลรุ่นใหม่ โดยจะกลับมาออกโมเดลคิดเป็นเหตุผล o3 และ o4-mini โมเดลคิดเป็นเหตุผลขนาดเล็กเวอร์ชันใหม่ ทั้งสองโมเดลนี้จะออกมาในอีกไม่กี่สัปดาห์ข้างหน้า

เรื่องนี้ต้องย้อนไปในเดือนกุมภาพันธ์ที่ OpenAI ออกโมเดล o3-mini มาก่อน จากนั้นอีกสองสัปดาห์ Altman บอกว่าบริษัทต้องการรวมโมเดลปัญญาประดิษฐ์ใหม่เพื่อลดความซับซ้อน ผู้ใช้งานไม่ต้องแยกโมเดลทั่วไป โมเดลคิดเป็นเหตุผล เลยทำให้ยกเลิกแผนการออกโมเดล o3 เวลานั้น

Tags:
Node Thumbnail

Midjourney ออกโมเดลปัญญาประดิษฐ์สร้างรูปภาพเวอร์ชันใหม่ V7 หลังจากไม่มีโมเดลเวอร์ชันใหม่ออกมาเกือบหนึ่งปี โดยสถานะการออกมาให้ใช้งานตอนนี้เป็น alpha-test และจะทยอยปรับปรุงความสามารถทุกสัปดาห์เป็นเวลา 2 เดือน

Midjourney บอกว่า V7 เป็นโมเดลสร้างรูปภาพที่ฉลาดที่สุด สร้างรูปได้สวยงามและแม่นยำที่สุดที่เคยทำออกมา David Holz ซีอีโอ Midjourney บอกว่า V7 มีการเปลี่ยนแปลงสถาปัตยกรรมการทำงานของโมเดลใหม่ทั้งหมด

ใน V7 ยังมีฟีเจอร์สำคัญคือโมเดลแบบปรับแต่งเฉพาะบุคคล ซึ่งผู้ใช้งานต้องป้อน Prompt และให้ความเห็นจำนวนหนึ่งก่อนจึงสามารถใช้งานได้ โดยโมเดลปรับแต่งเฉพาะบุคคลนี้มีจุดเด่นคือให้ผลลัพธ์ได้ตรงกับลักษณะรูปแบบที่ผู้ใช้งานแต่ละคนคาดหวังมากขึ้น

Tags:
Node Thumbnail

ทีม Qwen ของ Alibaba Cloud เปิดตัวโมเดลปัญญาประดิษฐ์เพิ่มสองรุ่น คือ Qwen2.5 Omni โมเดลแบบ multimodal อ่านภาพ, ฟังเสียง, และดูวิดีโอได้ พร้อมกับสามารถตอบเป็นเสียงหรือข้อความได้ อีกโมเดลคือ QVQ-Max โมเดลคิดก่อนตอบแบบอ่านภาพได้ ทำให้สามารถอ่านเอกสารซับซ้อนสูงได้

Qwen2.5 Omni เป็นโมเดล multimodal ที่รับได้ทั้งข้อความ, เสียง, และภาพ โดยภายในมันสามารถดูภาพตามเวลา (time aligned multimodal) ทำให้เข้าใจวิดีโอได้ด้วย ขณะที่ฝั่งเอาท์พุตนั้นสามารถสร้างเสียงตอบกลับได้ ตัวสถาปัตยกรรมรองรับการ "ฟังไป ตอบไป" โดยสามารถรับอินพุตยังไม่จบแต่ตอบไปก่อนได้

Qwen2.5 Omni มีโมเดลขนาด 7B ให้ดาวน์โหลดไปใช้ได้ฟรี ด้วยสัญญาอนุญาตแบบ Apache 2.0

Tags:
Node Thumbnail

ทีมวิจัยจาก UC San Diego อัพเดตรายงานทดสอบ Turing Test แบบจำกัดเวลา เพื่อทดสอบว่าปัญญาประดิษฐ์จะสามารถหลอกว่าเป็นมนุษย์ได้หรือไม่ จากเดิมที่เคยทดสอบตั้งแต่ปี 2023 และรอบนี้พบว่า GPT-4.5 เอาชนะมนุษย์ได้อย่างชัดเจน

กระบวนการทดสอบใช้จะให้ผู้ทดสอบคุยแชตกับ AI และมนุษย์ไปพร้อมกัน โดยสามารถคุยได้เพียง 8 ข้อความและจำกัดเวลา และเมื่อจบเวลา 5 นาทีก็ต้องเลือกว่าหน้าจอไหนเป็นมนุษย์หรือ AI โดยเมื่อปี 2023 นั้น GPT-4 ทำคะแนนได้สูงสุด 41% รอบนี้พบว่า GPT-4.5 สามารถทำคะแนนได้ถึง 73% สูงกว่ามนุษย์จริงๆ อย่างมีนัยสำคัญ

Tags:
Node Thumbnail

Sam Altman ซีอีโอ OpenAI ประกาศว่าเครื่องมือสร้างรูปภาพตัวใหม่ Image Generation บน ChatGPT ตอนนี้เปิดให้ผู้ใช้งานทุกคนสามารถใช้ได้แล้วรวมทั้งแบบฟรี หลังจากเปิดตัวไปเมื่อสัปดาห์ที่แล้ว โดยจำกัดให้เฉพาะลูกค้า ChatGPT แบบเสียเงิน

Altman ไม่ได้บอกว่าผู้ใช้งาน ChatGPT แบบฟรีจะถูกจำกัดการใช้งานเท่าใด แต่ก่อนหน้านี้เขาบอกตัวเลขว่า 3 รูปต่อวัน เนื่องจากผลตอบรับที่ดีมากเป็นกระแสจนจีพียูที่มีไม่พอใช้งาน

Tags:
Node Thumbnail

Amazon เปิดตัวโมเดลภาษาขนาดใหญ่ของตัวเองชื่อ Nova ในเดือนพฤศจิกายน 2024 หลังจากนั้นเริ่มนำมาใช้ในผลิตภัณฑ์คอนซูเมอร์อย่าง Alexa+ บ้างแล้ว

ล่าสุด Amazon เปิดตัว Amazon Nova Act โมเดลย่อยในตระกูล Nova ที่เทรนมาเพื่องานควบคุมการท่องเว็บผ่านเบราว์เซอร์โดยเฉพาะ เปิดทางให้เกิดงานสาย Agentic AI ที่นำ Nova Act ไปควบคุมหน้าเว็บต่างๆ ได้ง่ายผ่าน Nova Act SDK ที่เปิดให้นักพัฒนาภายนอกเข้ามาเชื่อมต่อ

Tags:
Node Thumbnail

Sam Altman ซีอีโอ OpenAI ประกาศว่าบริษัทมีแผนเตรียมออกโมเดล AI แบบ Open-Weight ตัวใหม่ นับตั้งแต่ GPT-2 โดยเปิดรับฟังความคิดเห็นจากนักพัฒนา นักวิจัย และชุมชนที่เกี่ยวข้อง ว่าต้องการให้โมเดล AI ที่ปรับค่า Weight ได้นี้ สามารถปรับส่วนใดได้บ้าง รวมทั้งเตรียมจัดงานสัมมนาแบบ In-Person ในหลายภูมิภาคเพื่อรับฟังความเห็นด้วย

ตั้งแต่กระแสปัญญาประดิษฐ์มีมากขึ้น OpenAI ซึ่งเป็นหนึ่งในผู้จุดกระแส ได้ปรับแนวทางไม่เผยแพร่รายละเอียดการทำงานของโมเดล AI ตั้งแต่ GPT-4 ด้วยเหตุผลของการแข่งขันและป้องกันการนำ AI ไปใช้ในทางที่ไม่ปลอดภัย อย่างไรก็ตามจากกระแสของ DeepSeek เมื่อต้นปี ซึ่งเป็นโมเดลแบบโอเพนซอร์ส รวมกับแนวทางของ Meta ที่โอเพนซอร์ส Llama ตั้งแต่เริ่มต้น ทำให้ Altman เคยยอมรับว่าตัดสินใจผิด และต้องการทบทวนกลยุทธ์นี้ อย่างไรก็ตามแนวทางของ Open-Weight จะไม่เปิดเผยข้อมูลทั้งหมดของโมเดล เช่น ข้อมูลที่ใช้ฝึกฝน เป็นต้น

Tags:
Topics: 
Node Thumbnail

Sundar Pichai ซีอีโอกูเกิลถามชุมชนว่าควรรองรับ MCP หรือไม่ หลังจากมาตรฐาน MCP ถูกเสนอโดย Anthropic และ OpenAI ก็ประกาศรองรับแล้ว ทำให้กูเกิลเป็นผู้พัฒนาปัญญาประดิษฐ์ LLM รายใหญ่รายเดียวที่ยังไม่รองรับ

เสียงตอบรับของคนส่วนใหญ่ก็ระบุว่าต้องการให้กูเกิลรองรับ MCP กัน ซึ่งก็คาดเดาได้เพราะคนจำนวนมากไม่ต้องการพัฒนาเครื่องมือแยกสำหรับกูเกิลอีกชุด

Tags:
Node Thumbnail

กูเกิลประกาศว่าผู้ใช้งานแบบฟรี สามารถใช้งาน Gemini 2.5 Pro (experimental) โมเดลปัญญาประดิษฐ์ความสามารถสูงที่เพิ่งเปิดตัวไม่กี่วันก่อนได้แล้ว โดยเวอร์ชันนี้เป็น experimental นั่นคือฟีเจอร์บางอย่างอาจไม่สามารถใช้งานได้

ในตอนแรกกูเกิลจำกัด Gemini 2.5 Pro ให้เฉพาะลูกค้า Gemini Advanced แต่ในเวลาไม่กี่วันกูเกิลก็บอกว่าเพื่อให้คนเข้าถึงโมเดลนี้มากที่สุด ลูกค้าฟรีก็ได้ใช้งานไปด้วยเลย

ผลทดสอบ Gemini 2.5 Pro มีคะแนนโดดเด่นในทุกด้านซึ่งกูเกิลก็บอกเองว่าเป็นโมเดลที่ฉลาดที่สุดในตอนนี้ ด้วยวิธีฝึกฝนแบบ Reinforced และใช้การคิดเป็นลำดับขั้นก่อนให้คำตอบ

Tags:
Node Thumbnail

Sam Altman ซีอีโอ OpenAI เปิดเผยว่ากระแสที่มาแรงมาของเครื่องมือสร้างรูปภาพตัวใหม่ Image Generation บน ChatGPT ทำให้ตอนนี้จีพียูที่มีอยู่ไม่พอแล้ว (GPUs are melting) จึงทำให้ OpenAI ต้องหาทางแก้ไขปัญหานี้

Altman บอกแนวทางเบื้องต้นคือการจำกัดปริมาณการใช้งานชั่วคราว แต่ไม่ได้บอกว่าจะเป็นแบบใด ขณะเดียวกันก็ปรับปรุงการทำงานของโมเดลให้มีประสิทธิภาพมากขึ้นด้วย ส่วนผู้ใช้งาน ChatGPT แบบฟรี จะได้เข้าถึง Image Generation เร็ว ๆ นี้ โดยจำกัดที่ 3 รูปภาพต่อวัน

Tags:
Node Thumbnail

Sam Altman ซีอีโอ OpenAI กล่าวว่าบริษัทจะสนับสนุน Model Context Protocol (MCP) โปรโตคอลมาตรฐานสำหรับการดึงข้อมูลและส่งข้อมูลจากแหล่งต่าง ๆ กับโมเดลปัญญาประดิษฐ์สำหรับองค์กร ซึ่งเป็นมาตรฐานที่บริษัทคู่แข่ง Anthropic นำเสนอเมื่อปลายปีที่แล้ว โดย MCP จะรองรับในทุกผลิตภัณฑ์ของ OpenAI

MCP มีให้ใช้งานแล้วผ่าน SDK สำหรับนักพัฒนา AI Agent ตั้งแต่วันนี้เป็นต้นไป ส่วนแอป ChatGPT บนเดสก์ท็อปและ Responses API จะรองรับเร็ว ๆ นี้

Tags:
Node Thumbnail

Databricks ประกาศความร่วมมือกับ Anthropic เป็นระยะเวลา 5 ปี เพื่อนำโมเดลปัญญาประดิษฐ์ของ Anthropic ให้บริการบนแพลตฟอร์ม Data Intelligence Platform ทำให้ลูกค้าองค์กรมากกว่า 10,000 ราย สามารถเข้าถึงโมเดลตระกูล Claude เพื่อสร้างแชทบอตและ AI Agent แบบคัสตอมสำหรับใช้กับข้อมูลในองค์กร

Databricks บอกว่าลูกค้าองค์กรมีการลงทุนด้าน AI ที่เพิ่มมากขึ้น แต่มีอุปสรรคในการสร้างและดีพลอย AI Agent ที่สามารถเรียนรู้และทำความเข้าใจข้อมูลระดับลูกค้าองค์กร พร้อมกับให้คำตอบได้อย่างแม่นยำตามข้อกำหนดที่องค์กรต้องการ ซึ่งรวมถึงความปลอดภัยข้อมูล การจัดการการเข้าถึง ข้อตกลงร่วมกันของ Databricks และ Anthropic จึงเข้ามาเติมความต้องการนี้

Tags:
Node Thumbnail

ทีม ARC Prize ประกาศการแข่งขัน ARC-AGI-2 ข้อสอบไอคิวสำหรับมนุษย์ที่ยังยากสำหรับปัญญาประดิษฐ์ หลังจากข้อสอบชุดแรกเปิดตัวมาตั้งแต่ปี 2020 และตอนนี้มี AI ได้คะแนนสูงสุดคือ o3 ที่ 82.8%

ARC-AGI-2 เป็นข้อสอบที่ทำโดยมษุย์สำเร็จทุกข้อ หากให้ช่วยกันสองคน และมนุษย์โดยทั่วไปเฉลี่ยได้คะแนน 60% ตอนนี้โมเดลที่ดีที่สุดคือ o3 ทำคะแนนได้เพียง 4%

รางวัลรวมของ ARC-AGI-2 อยู่ที่ 1 ล้านดอลลาร์ รางวัลที่หนึ่งเป็นเงิน 700,000 ดอลลาร์หากทำคะแนนได้เกิน 80% และต้องใช้ต้นทุนประมวลผลไม่เกิน 50 ดอลลาร์เท่านั้น

ที่มา - ARC Prize

Tags:
Topics: 
Node Thumbnail

Databricks นำเสนอแนวทางการฝึกโมเดลปัญญาประดิษฐ์แบบ LLM ในชื่อว่า Test-time Adaptive Optimization (TAO) ที่มุ่งเป้าไปยังองค์กรที่ใช้งาน LLM อยู่แล้วแต่ต้องการโมเดลสำหรับใช้งานภายในที่เก่งใกล้เคียงกัน

แนวทางของ TAO แยกออกเป็นสี่ขั้น ได้แก่

Pages