กูเกิลประกาศว่าผู้ใช้งานแบบฟรี สามารถใช้งาน Gemini 2.5 Pro (experimental) โมเดลปัญญาประดิษฐ์ความสามารถสูงที่เพิ่งเปิดตัวไม่กี่วันก่อนได้แล้ว โดยเวอร์ชันนี้เป็น experimental นั่นคือฟีเจอร์บางอย่างอาจไม่สามารถใช้งานได้
ในตอนแรกกูเกิลจำกัด Gemini 2.5 Pro ให้เฉพาะลูกค้า Gemini Advanced แต่ในเวลาไม่กี่วันกูเกิลก็บอกว่าเพื่อให้คนเข้าถึงโมเดลนี้มากที่สุด ลูกค้าฟรีก็ได้ใช้งานไปด้วยเลย
ผลทดสอบ Gemini 2.5 Pro มีคะแนนโดดเด่นในทุกด้านซึ่งกูเกิลก็บอกเองว่าเป็นโมเดลที่ฉลาดที่สุดในตอนนี้ ด้วยวิธีฝึกฝนแบบ Reinforced และใช้การคิดเป็นลำดับขั้นก่อนให้คำตอบ
กูเกิลประกาศเพิ่มฟีเจอร์ใหม่หลายอย่างบน Google Search, Google Maps และ Gemini สำหรับวางแผนการท่องเที่ยวเดินทาง ก่อนเข้าสู่ฤดูร้อน มีรายละเอียดดังนี้
สองฟีเจอร์นี้เปิดให้ใช้งานกับผู้ใช้งานทั่วโลกแล้ว
Google Meet มีฟีเจอร์ใช้ Gemini ช่วยฟังเสียงและสรุปการประชุมมาตั้งแต่เดือนสิงหาคม 2024 ล่าสุดกูเกิลประกาศเพิ่มฟีเจอร์ดังนี้
กูเกิลเปิดตัวโมเดล LLM ตัวใหม่ Gemini 2.5 Pro ที่พัฒนาความเก่งโดยอาศัยการฝึกจนกว่าจะทำแบบทดสอบถูก (reinforced learning) และฝึกให้คิดก่อนตอบ (chain of thought) โดยระบุว่าหลังจากนี้จะฝึกโมเดลต่อๆ ไปโดยฝังแนวทางคิดก่อนตอบไว้เสมอเพื่อให้โมเดลมีความสามารถสูง
ผลทดสอบ Gemini 2.5 Pro ด้านการเขียนโปรแกรมนั้นสูงขึ้นมาก ผลทดสอบ Aider สูงสุดในตอนนี้เหนือ DeepSeek-R1 แม้ว่าผลทดสอบ SWE-bench verified ที่เน้นปัญหาจริงจะยังแพ้ Claude 3.7 แต่ก็นับว่าใกล้เคียงขึ้นมาก ผลการทดสอบบน LM Arena นั้นตอนนี้ Gemini 2.5 Pro ขึ้นที่หนึ่งทั้งตาราง ใกล้เคียงกับ GPT-4.5 และ Grok-3 Preview
อีกประเด็นที่น่าสนใจของ Google Pixel 9a มือถือราคาประหยัดของกูเกิล คือการให้แรม 8GB ซึ่งน้อยกว่า 12GB ของ Pixel 9 รุ่นใหญ่ที่มีโมเดล Gemini Nano คำถามสำคัญของยุคนี้คือแรม 8GB เพียงพอต่อการรันฟีเจอร์ AI ยุคใหม่ๆ หรือไม่
คำตอบของกูเกิลคือ Pixel 9a ใช้โมเดล Gemini Nano 1.0 รุ่น XXS ที่ขนาดเล็กลงกว่าปกติ บีบให้ยัดลงใน Pixel 9a ได้ แถมโมเดล XXS ยังไม่ได้รันตลอดเวลาเหมือนกับ Pixel รุ่นใหญ่ แต่โหลดโมเดลเข้ามาเฉพาะตอนที่ใช้งานเท่านั้น
กูเกิลประกาศเพิ่มเครื่องมือใหม่ให้กับผู้ใช้งานปัญญาประดิษฐ์ Gemini มีรายละเอียดดังนี้
Canvas เป็นพื้นที่ให้ผู้ใช้งานแชทบอต Gemini สามารถปรับแก้ไขเนื้อหาผลลัพธ์ได้อย่างต่อเนื่อง คล้ายกับเครื่องมือแชทบอตของค่ายอื่น รองรับทั้งการแก้ไขเอกสารเป็นจุดที่ต้องการ สามารถส่งออกผลลัพธ์ไปยัง Google Docs ได้ เพื่อความต่อเนื่อง
นอกจากนี้ Canvas ยังรองรับการให้คำแนะนำและแก้ไขโค้ด สามารถแสดงพรีวิวผลลัพธ์ที่เป็น HTML/React ได้เลยผ่านอินเทอร์เฟซของ Canvas
Canvas เริ่มอัปเดตให้ผู้ใช้งานทั่วโลกในทุกภาษาที่ Gemini รองรับ สำหรับลูกค้า Gemini และ Gemini Advanced
เรารู้กันอยู่แล้วว่า Google Assistant จะถูกแทนด้วย Gemini สักวัน และวันนั้นก็ใกล้มาถึง กูเกิลประกาศอัพเกรด Google Assistant บนสมาร์ทโฟนเป็น Gemini ภายในปี 2025 (ยังไม่ระบุเดือน) หลังจากนั้น Google Assistant จะไม่สามารถทำงานต่อได้
สมาร์ทโฟนกลุ่มที่จะไม่ได้ไปต่อกับ Gemini คือ Android 9 ลงไป และมีแรมน้อยกว่า 2GB
หลังจากรอบของสมาร์ทโฟนแล้ว กูเกิลบอกว่าจะอัพเกรด Google Assistant บนอุปกรณ์ประเภทอื่น เช่น แท็บเล็ต นาฬิกา หูฟัง รถยนต์ ในระยะถัดไป รวมถึงจะเพิ่มฟีเจอร์ Gemini ให้อุปกรณ์ในบ้าน เช่น ลำโพง หน้าจอ สมาร์ททีวีด้วย รายละเอียดเพิ่มเติมจะทยอยประกาศในอีกไม่กี่เดือนข้างหน้า
กูเกิลประกาศเพิ่มฟีเจอร์ใหม่หลายอย่างให้กับผู้ใช้งาน Gemini ซึ่งมีทั้งส่วนที่เพิ่มความสามารถในการคิด และส่วนที่ทำให้ Gemini ตอบคำถามแบบปรับแต่งค่าตามความสนใจของผู้ใช้งานแต่ละคน
ของใหม่อย่างแรก กูเกิลบอกว่าได้อัปเกรด Gemini 2.0 Flash Thinking Experimental รองรับการอัปโหลดไฟล์ ตอบคำถามแบบเป็นขั้นตอนที่ละเอียดขึ้น มีประสิทธิภาพการตอบสนองเร็วขึ้น โดยลูกค้า Gemini Advanced ยังใช้อินพุทได้สูงสุด 1M โทเค็น จึงเหมาะกับการวิเคราะห์แก้ปัญหาด้วยชุดข้อมูลขนาดใหญ่
Google DeepMind เปิดตัวโมเดลปัญญาประดิษฐ์ที่มีพื้นฐานจาก Gemini 2.0 สำหรับใช้งานกับหุ่นยนต์ผู้ช่วย ได้แก่ Gemini Robotics
และ Gemini Robotics-ER
(Extended Reasoning) ที่เพิ่มความสามารถเชื่อมต่อกับซอฟต์แวร์หุ่นยนต์ที่มี เป้าหมายให้เป็น AI ที่สร้างผลลัพธ์ออกมาเป็นคำสั่งให้ทำสิ่งต่าง ๆ (Action) ซึ่งเป็นพื้นฐานของหุ่นยนต์
กูเกิลบอกว่าได้ร่วมมือกับ Apptronik ในการพัฒนาหุ่นยนต์เหมือนมนุษย์ (Humanoid) เพื่อทดสอบการใช้โมเดล AI ของหุ่นยนต์บน Gemini 2.0 นี้
กูเกิลอัพเกรดฟีเจอร์ของ Google Meet และ Google Chat เวอร์ชันองค์กร (Business/Enterprise) เพิ่มพลัง Gemini เข้ามาหลายด้าน
Google Meet
Google Chat
กูเกิลเปิดตัวโมเดล LLM แบบโหลดไปใช้งานได้เอง Gemma 3 โดยชูผลทดสอบใน Chatbot Arena ว่ารุ่นใหญ่สุดที่ขนาดเพียง 27B สามารถเอาชนะ DeepSeek-V3, Llama 3 405B, และ o3-mini ได้
ฟีเจอร์สำคัญของ Gemma 3 คือการขยาย context widow เป็น 128,000 โทเค็น ทำให้รับข้อมูลไปประมวลผลได้เยอะขึ้นมาก รวมถึงอินพุตเป็นภาพ ทำให้ใช้งานได้ใกล้เคียง Gemini มากขึ้น โดยโมเดลขนาด 27B นี้กูเกิลชูว่ามีความสามารถสูงโดยที่ยังรันบนการ์ดใบเดียวได้ โดยเวอร์ชั่นนี้มาพร้อมกับรุ่นลดความละเอียดจากกูเกิลอย่างเป็นทางการ
สามารถใช้งานได้แล้วบน Google AI Studio, ollama, หรือแม้แต่ใช้ serverless อย่าง Cloud Run
ที่มา - Google Blog
กูเกิลเผยแพร่ Gemini Embedding โมเดลปัญญาประดิษฐ์สำหรับทำ Embedding ที่ฝึกฝนจาก Gemini ซึ่งกูเกิลบอกว่าผลการทดสอบของ gemini-embedding-exp-03-07
ทำได้ดีมากกว่าโมเดลรุ่นก่อนหน้าของกูเกิลคือ text-embedding-004
รวมทั้งโมเดลสำหรับทำ Embedding ตัวอื่น
Embedding เป็นขั้นตอนแปลงข้อมูลข้อความที่เป็นคำหรือประโยค ให้อยู่ในรูปตัวเลขสำหรับการทำ Classification หรือ Categorization ช่วยให้การทำงานมีต้นทุนประมวลผลที่ลดลง แต่ยังได้ประสิทธิภาพผลลัพธ์ที่สูง
กูเกิลบอกว่าจุดเด่นคือชุดฝึกฝนข้อมูลทำให้ Gemini Embedding รองรับการแปลงข้อมูลเฉพาะหัวข้อที่หลากหลายตั้งแต่ การเงิน วิทยาศาสตร์ กฎหมาย การค้นข้อมูล และอื่น ๆ
กูเกิลเปิดตัวฟีเจอร์ "AI Mode" ให้ Google Search มันคือการยกระดับฟีเจอร์ AI Overview ที่สรุปคำตอบแบบสั้นๆ ให้ตอบยาวขึ้น เหมือนการแชทคุยกับ Gemini โดยตรง แต่ทำได้จากหน้า Search โดยตรง
AI Mode ไม่ได้มาแทน AI Overview โดยตรง แต่เป็นโหมดเพิ่มเติมสำหรับผู้ใช้ที่ต้องการรายละเอียดมากขึ้น เบื้องหลังการทำงานของมันใช้โมเดล Gemini 2.0 เวอร์ชันคัสตอม ที่มีการให้เหตุผลมากขึ้น คิดนานขึ้น รองรับชนิดอินพุตหลายรูปแบบ (multimodal) ผสมผสานกับคลังข้อมูลของ Google Search ที่มีอยู่แล้ว เพื่อให้ตอบคำถามที่ยากๆ ได้
ย้อนไปเมื่อปลายปี 2023 มีข่าวว่ากูเกิลจะเปิดตัวผู้ช่วย AI บน Pixel 9 ที่อาศัยข้อมูลในโทรศัพท์ มีการปรับแต่งค่าให้เข้ากับผู้ใช้งานมากกว่า Google Assistant เรียกชื่อตอนนั้นว่า Pixie (x ตัวเดียวไม่ใช่สองตัว) แต่ฟีเจอร์นี้ก็ไม่มีออกมา
Android Authority อ้างแหล่งข่าวในกูเกิลบอกว่าโครงการผู้ช่วย AI บนสมาร์ทโฟน Pixel ยังมีอยู่แต่เปลี่ยนชื่อใหม่เป็น Pixel Sense ระบุว่าเป็นผู้ช่วยที่ให้ประสบการณ์ใช้งานบน Pixel ได้อย่างดีที่สุดสำหรับแต่ละคน
แอป Gemini บน iOS อัปเดตเวอร์ชันใหม่ ผู้ใช้งานสามารถเพิ่ม widget ได้ จึงทำให้สามารถเรียกใช้งาน Gemini ได้จากหน้าจอล็อกหรือผ่าน Control Center
รายการ widget ที่มีในแอป Gemini บน iOS ได้แก่: ป้อน prompt ข้อความ, สนทนา Talk Live, เปิดไมโครโฟนเพื่อบันทึก, เปิดกล้องเพื่อให้ Gemini ค้นหาข้อมูล, แชร์รูปภาพ และแชร์ไฟล์ ซึ่งโดยรวมแล้วการทำงานก็คล้ายกันแตกต่างที่อินพุท
ในอัปเดตนี้ยังรองรับการใช้งาน Deep Research สำหรับลูกค้า Gemini Advanced และเพิ่มแอป Gemini ในการแชร์ข้อมูลจากแอปอื่นด้วย
ที่มา: 9to5Google
กูเกิลไปจัดบูทที่งาน Mobile World Congress 2025 ที่บาร์เซโลนา โดยโชว์ฟีเจอร์ Gemini Live เปิดกล้องเพื่อสำรวจโลกรอบตัวด้วยภาพ ประกอบการสนทนากับผู้ใช้ หรือที่เรารู้จักกันในชื่อ Project Astra มาตั้งแต่งาน Google I/O 2024 เดือนพฤษภาคมปีที่แล้ว
กูเกิลบอกว่าจะเริ่มปล่อย Gemini Live ฟีเจอร์ live video และ screen sharing ให้กับลูกค้า Gemini Advanced แบบเสียเงิน ภายในเดือนมีนาคม 2025
เมื่อต้นปีนี้ กูเกิลบอกว่าจะปล่อยฟีเจอร์ Gemini Live ให้กับ Galaxy S25 เป็นรุ่นแรก แต่ไม่บอกว่าเมื่อไร คู่แข่งของฟีเจอร์นี้คือโมเดลมองโลกด้วยกล้องของ GPT-4o ซึ่งยังไม่ปล่อยออกสู่สาธารณะเช่นกัน
Deutsche Telekom โอเปอเรเตอร์รายใหญ่ของเยอรมนี (บริษัทแม่ของ T-Mobile) ประกาศความร่วมมือกับ Perplexity ว่าจะพัฒนาสมาร์ทโฟนที่เรียกว่า "AI Phone" ร่วมกัน
แกนหลักของ AI Phone คือฟีเจอร์ Magenta AI (ตั้งชื่อตามสีของบริษัท Deutsche Telekom) เป็นชุดรวมบริการด้าน AI แบบที่เราคุ้นเคยในปัจจุบัน ภายในมีระบบ AI หลายตัวจากหลายบริษัท แกนหลักของมันคือ Perplexity Assistant ระบบผู้ช่วยส่วนตัวของ Perplexity (ใช้คำว่า co-pilot แต่เป็นตัวเล็กหมด) และในอนาคตจะเพิ่มระบบ AI จากบริษัทอื่น ที่ระบุชื่อได้แก่
The New York Times อ้างว่าได้เห็นบันทึกภายในของ Sergey Brin ผู้ร่วมก่อตั้งกูเกิล ที่กลับมาช่วยงานด้าน AI ของบริษัท เขาเขียน "แนะนำ" (recommend) ให้พนักงาน (เฉพาะทีม Gemini) เข้าออฟฟิศทุกวัน
Brin มองว่าเวลาทำงานในออฟฟิศ 60 ชั่วโมงต่อสัปดาห์ ถือเป็นจุดที่เหมาะสมสำหรับการสร้างผลิตภาพ (60 hours a week is the sweet spot of productivity) แต่เขาก็เขียนชัดว่าไม่ควรทำงานเกิน 60 ชั่วโมงต่อสัปดาห์เพราะอาจเกิดปัญหาเบิร์นเอาท์ได้ ส่วนการทำงานน้อยกว่า 60 ชั่วโมงต่อสัปดาห์ยังจะส่งผลให้ดึงกำลังใจของเพื่อนร่วมงานให้ตกต่ำลง
กูเกิลประกาศว่าโมเดล Gemini 2.0 Flash-Lite น้องเล็กสุดในซีรีส์ Gemini 2.0 ที่เพิ่งเปิดตัวเมื่อต้นเดือน เข้าสถานะ generally available (GA) เรียกใช้ผ่าน Gemini API ได้โดยตรง
ความสำคัญของเรื่องนี้คือ Gemini 2.0 Flash-Lite มาแทนโมเดล Gemini 1.5 Flash เดิม โดยคงโครงสร้างราคาเท่ากันคือค่าอินพุต 0.075 ดอลลาร์ต่อ 1 ล้านโทเคน ซึ่งถือว่าถูกเป็นอันดับต้นๆ ของอุตสาหกรรมในตอนนี้ (เทียบกับ GPT-4o mini ที่คิดค่าอินพุต 0.15 ดอลลาร์ต่อ 1 ล้านโทเคน แพงกว่ากันเท่าตัว) มันจึงจะกลายเป็นโมเดลที่องค์กรต่างๆ นำไปเรียกใช้ผ่าน API เป็นหลัก ด้วยเหตุผลเรื่องคุณภาพต่อราคาที่เหนือกว่าใคร
กูเกิลเปิดบริการ AI ช่วยเขียนโค้ด Gemini Code Assist ให้คนทั่วไปใช้งานฟรี จากเดิมคิดราคา 19 ดอลลาร์ต่อคนต่อเดือน
Gemini Code Assist เวอร์ชันปัจจุบันใช้โมเดล Gemini 2.0 รุ่นใหม่ล่าสุดเวอร์ชันที่ปรับแต่งมาเพื่อการเขียนโค้ด รองรับภาษาโปรแกรมทุกตัว วิธีการใช้งานตอนนี้ยังรองรับเฉพาะบน Visual Studio Code และ IDE ในเครือ JetBrains
กูเกิลประกาศว่า Gemini Deep Research ฟีเจอร์สำหรับการค้นหาและสรุปข้อมูลเชิงลึกด้วย Gemini เปิดให้ใช้งานแล้วสำหรับลูกค้า Google Workspace ที่มีสิทธิเข้าถึง Gemini Advanced
Deep Research เป็นคุณสมบัติยอดนิยมที่ผู้พัฒนาปัญญาประดิษฐ์นิยมนำเสนอช่วงนี้ โดยสามารถค้นหาข้อมูลเชิงลึก เช่น แนวโน้มในอุตสาหกรรม, พฤติกรรมลูกค้า หรืองานวิจัยต่าง ๆ ซึ่งเดิมต้องค้นหาข้อมูลจากหลายแหล่งข้อมูลรวมกัน แต่ Deep Research สามารถดำเนินการได้ทั้งหมดผ่าน prompt และ Gemini จะแสดงขั้นตอนการทำงานให้
Deep Research รองรับการทำงานเฉพาะภาษาอังกฤษในตอนนี้ สามารถใช้งานได้ทั้งผ่านเว็บและแอป Gemini บนสมาร์ทโฟน
กูเกิลทลายข้อจำกัดของ Gemini เวอร์ชันฟรี ที่ก่อนหน้านี้ไม่สามารถแนบไฟล์ให้ Gemini อ่านได้ (จำกัดเฉพาะเวอร์ชันเสียเงิน) ตอนนี้เราสามารถแนบไฟล์ Google Docs, Word, PDF เพื่อให้ Gemini อ่าน สรุปเนื้อหา ถามตอบได้ แบบเดียวกับแชทบอท AI ตัวอื่นๆ ในท้องตลาด
ฟีเจอร์นี้มีผลแล้วทั้งเวอร์ชันเว็บและแอพบน Android/iOS วิธีใช้งานคือกดปุ่ม + ในช่อง prompt แล้วเลือกแนบไฟล์ได้เลย
ที่มา - Android Central
กูเกิลเปิดตัว "เพื่อนนักวิทยาศาสตร์เสมือน" (AI co-scientist หรือ virtual scientific collaborator) เป็นการนำ Gemini 2.0 มาปรับแต่งเพื่อเป็นคู่คิดให้นักวิทยาศาสตร์ ช่วยเสนอสมมติฐานและแผนการวิจัย ตามโจทย์วิจัยที่ได้รับมอบหมาย
ผู้ช่วยนักวิทยาศาสตร์ AI ใช้ระบบ multi-agent สร้าง agent หลายๆ ตัวมารับบทบาทที่แตกต่างกัน เช่น ช่วยคิดไอเดีย ตรวจสอบไอเดีย ให้คะแนนไอเดีย ฯลฯ แล้วนำไอเดียที่ได้มาจัดลำดับคะแนน ตัว agent สามารถค้นหาข้อมูลในเว็บ หรือเรียกใช้โมเดลเฉพาะทางอื่นๆ เพื่อตรวจสอบความเป็นไปได้ของสมมติฐาน
นอกจากการระดมสมองหาไอเดียที่มีคุณภาพแล้ว ผู้ช่วยนักวิทยาศาสตร์ยังสามารถทำแผนการวิจัย จัดแบ่งทรัพยากร จัดคิวงาน ให้เราได้ด้วย
กูเกิลแจ้งผู้ใช้งานแอป Google บน iOS ว่าฟังก์ชันการเรียกใช้งาน Gemini AI จะถูกนำออกจากแอป Google ซึ่งเดิมเป็นช่องทางหลักในการใช้ Gemini บน iOS โดยสลับโหมดกับ Google Search
โดยกูเกิลแจ้งว่าให้ย้ายไปใช้งาน Gemini ผ่านแอป Gemini บน iOS ที่ออกมาตั้งแต่ปลายปีที่แล้ว ซึ่งกูเกิลบอกว่านอกจากจะได้ใช้งาน Gemini เหมือนเดิมแล้ว ฟีเจอร์ใหม่ที่เดิมไม่มีในแอป Google จะถูกนำมาใส่ในแอป Gemini นี้ เช่น การคุยเสียง Gemini Live
ที่มา: 9to5Google
กูเกิลประกาศฟีเจอร์เพิ่มเติมให้ Gemini (เฉพาะ Gemini Advanced แบบเสียเงิน) จดจำการสนทนาในอดีตได้แล้ว เราสามารถสั่งให้ Gemini สรุปการพูดคุยในอดีต หรือถามข้อมูลที่เคยถามไปแล้วได้ โดยไม่ต้องมานั่งคิด prompt ใหม่ หรือไปนั่งขุดประวัติการสนทนา
ฟีเจอร์นี้สามารถปิดได้ถ้าไม่ต้องการในหน้า My Activity ของ Gemini รวมถึงสามารถตั้งค่าได้ว่าจะให้เก็บประวัติการสนทนานานแค่ไหน
ที่มา - Google Blog