กูเกิลขยายบริการ NotebookLM แอปจดโน้ตพลัง Gemini 1.5 Pro ที่ช่วยผู้ใช้เขียนรายงานได้อย่างรวดเร็วหลังจากเปิดตัวเฉพาะในสหรัฐฯ ช่วงปลายปี 2023 โดยตอนนี้ใช้ Gemini 1.5 Pro ทำให้รองรับการอ่านรูปภาพ สามารถอ้างอิงข้อมูลในภาพของเอกสารที่ใส่เข้าไปได้
แนวทางการใช้งานสร้างเอกสาร เช่น การสร้างคำถามที่พบบ่อย, เอกสารสรุปย่อการประชุม, หรือบทเรียน โดยหลักๆ แล้ว NotebookLM เป็นการพูดคุยกับ Gemini โดยอาศัยเอกสารที่ผู้ใช้มอบให้เป็นหลัก ทำให้แน่ใจได้ว่าการพูดคุยนั้นอยู่ในประเด็นที่ต้องการ
ตั้งแต่ช่วงบ่ายเมื่อวานนี้ (อังคาร 4 มิถุนายน 2024) ผู้ใช้งาน ChatGPT จำนวนมากพบปัญหาไม่ใช่สามารถใช้งานได้ โดย OpenAI ยืนยันปัญหาที่เกิดขึ้น 2 ครั้ง โดยรอบแรกเกิดตั้งแต่เวลา 14:21น. และกลับมาเป็นปกติเวลา 18:45น. ส่วนรอบที่สองเริ่มเกิดปัญหาเวลา 21:33น. กลับมาเป็นปกติเวลาเที่ยงคืน ทั้งหมดตามเวลาในประเทศไทย
OpenAI บอกว่าปัญหาที่เกิดขึ้นกระทบกับการใช้งาน ChatGPT สำหรับลูกค้าทุกแผน ทั้งบนเบราว์เซอร์และผ่านแอปมือถือ แต่ไม่กระทบการใช้งาน API หรือ platform.openai.com
Opera ประกาศนำโมเดล Gemini ของ Google Cloud มาใช้งานกับฟีเจอร์ Aria AI ในเว็บเบราว์เซอร์ Opera One ของตัวเอง
Opera เปิดตัวฟีเจอร์ AI ในเบราว์เซอร์มาตั้งแต่กลางปี 2023 โดยระบุว่าใช้โมเดล LLM หลายค่าย และเปิดให้ผู้ใช้เลือกโมเดลที่เหมาะสมกับตัวเองได้ จากโมเดลทั้งหมดที่มีให้เลือกมากกว่า 50 ตระกูล 150 เวอร์ชันย่อย (หนึ่งในนั้นคือ GPT ของ OpenAI ที่มีมาตั้งแต่เปิดตัว)
ก่อนหน้านี้ Opera ใช้โมเดลสร้างภาพ Imagen 2 และโมเดลแปลงข้อความเป็นเสียง Wavenet ของ Google Cloud อยู่ก่อนแล้ว ส่วน Gemini จะเข้ามาเสริมในฟีเจอร์สรุปหรือช่วยเขียนข้อความที่ชื่อว่า Compose
กูเกิลประกาศข่าวฟีเจอร์ใหม่ของโน้ตบุ๊กกลุ่มพรีเมียม Chromebook Plus ที่เปิดตัวในปีที่แล้ว จะได้ฟีเจอร์ Gemini AI เข้ามาช่วยทำงานให้ฉลาดกว่าเดิม มีผลกับโน้ตบุ๊กทุกรุ่นทุกยี่ห้อที่เข้าข่าย Chromebook Plus
ฟีเจอร์ Gemini AI ที่เพิ่มเข้ามาให้ Chromebook Plus ไม่ต่างจากที่เราใช้ผ่านหน้าเว็บเบราว์เซอร์กันในปัจจุบัน เช่น ฟีเจอร์ช่วยเขียนช่วยแต่งประโยค Help Me Write, ฟีเจอร์สร้างภาพวอลล์เปเปอร์ด้วย Generative AI, แต่งภาพ Magic Editor ในแอพ Google Photos และมีเพิ่มไอคอน Gemini เข้ามาในแถบทาสก์บาร์ด้านล่าง สำหรับเข้าหน้าเว็บคุยกับ Gemini ได้ทันทีด้วย
Google Meet เพิ่มฟีเจอร์ adaptive audio แก้ปัญหาเมื่อผู้ใช้หลายคนเปิดไมโครโฟนในห้องเดียวกันแล้วเสียงสะท้อนหรือหอน กลายเป็นการรวมเสียงเข้าด้วยกันเหมือนใช้ไมโครโฟนกลาง
ผู้ใช้ที่มีสิทธิ์จะเปิด Adaptive Audio ได้เอง และเมื่อเปิดใช้งานแล้วจะสามารถพูดใส่โน้ตบุ๊กของตัวเองได้ต่อไป ไม่ต้องไปนั่งรุมโน้ตบุ๊กกลางในห้องประชุมอีก
ฟีเจอร์นี้จำกัดเฉพาะลูกค้าแพ็กเกจ Gemini Enterprise, Gemini Business, Gemini Education, Gemini Education Premium, และผู้ซื้อแพ็กเสริม AI Meetings and Messaging โดยจะเริ่มปล่อยชุดแรกสำหรับคนที่ตั้ง Rapid Release ในเดือนนี้ และ Scheduled Release ในเดือนหน้า
โฆษกของ HONOR เปิดเผยกับ CNBC ว่าสมาร์ทโฟนรุ่นถัดไปที่ออกมาของบริษัท จะมีฟีเจอร์ปัญญาประดิษฐ์ที่เป็น Google AI ซึ่งรวมทั้งแชทบอตผู้ช่วย Gemini และเครื่องมือสร้างรูปภาพ Imagen 2
การนำ Google AI มาใส่ในสมาร์ทโฟน จะทำให้ HONOR เป็นผู้ผลิตสมาร์ทโฟนรายล่าสุด ที่เลือกใช้ฟีเจอร์ปัญญาประดิษฐ์จากกูเกิลเหมือนกับซัมซุงที่ออกมาก่อนหน้านี้
ก่อนหน้านี้ HONOR เปิดตัว HONOR Magic 6 Pro ที่มีฟังก์ชันปัญญาประดิษฐ์ที่ HONOR พัฒนาเอง เช่น ใช้ AI กดถ่ายรูปให้โดยอาศัยการตรวจจับการเคลื่อนไหว
ที่มา: CNBC
ในงาน Google I/O 2024 ของใหม่อย่างหนึ่งที่เรียกเสียงฮือฮาในงานคือการโชว์โมเดล Gemini Nano รันในมือถือแอนดรอยด์โดยตรง ทำงานออฟไลน์ แล้วสามารถตรวจสอบการสนทนาที่เป็น scam หลอกหลวงได้ เป็นการโชว์ประโยชน์ของการรันโมเดลในมือถือให้เห็นชัดๆ ว่าทำอะไรได้บ้าง
หลังจากนั้นกูเกิลยังได้ออกวิดีโอเซสชัน Android on-device AI under the hood มาอธิบายรายละเอียดของการรันโมเดลในมือถือแอนดรอยด์เพิ่มเติม มีรายละเอียดดังนี้
กูเกิลเปิดตัวโมเดล AI ที่ชื่อ Gemini มาตั้งแต่ปีที่แล้ว ปัจจุบัน Gemini กลายเป็นเอ็นจินหลักของ Google AI แต่เรื่องหนึ่งที่กูเกิลไม่เคยบอกคือทำไมจึงเลือกใช้ชื่อ Gemini ที่เป็นกลุ่มดาวคนคู่ และหมายถึงราศีเมถุนใน 12 ราศี มาเป็นคำเรียก AI ของบริษัท
กูเกิลบอกว่าเรื่องนี้ต้องให้ทีมปัญญาประดิษฐ์ DeepMind ที่เป็นคนที่เลือกใช้ชื่อนี้มาอธิบาย คำตอบคือเดิมทีโครงการ AI นี้จะใช้ชื่อว่า Titan (แล้วจะซ้ำกับแอปเปิล) โดยเป็นชื่อดวงจันทร์ขนาดใหญ่ที่สุดของดาวเสาร์ แต่ทีมงานดูไม่ชอบเท่าใดนัก อย่างไรก็ตามการเลือกชื่อ Titan มาก่อน ทำให้ธีมการตั้งชื่อถูกตีกรอบให้อยู่ในดวงดาวและจักรวาล
กูเกิลเปิดโครงการทดลอง Built-in AI เตรียมนำ Gemini Nano มารันใน Chrome โดยตรง เปิดทางให้เบราว์เซอร์มี API ในกลุ่ม LLM เพิ่มเติม
ฟีเจอร์ที่เว็บไซต์จะสามารถใช้งาน LLM บนเว็บได้ เช่น การช่วยสรุป หรือถามตอบคำถามในเนื้อหาบนเว็บเอง ไปจนถึงการเป็นตัวช่วยผู้ใช้เขียนเนื้อหา หรือตรวจคำผิด
ทุกวันนี้เว็บไซต์หลายแห่งรันโมเดลปัญญาประดิษฐ์บนเว็บอยู่แล้ว แต่การใช้งานแบบทุกวันนี้ทำให้ผู้ใช้ต้องดาวน์โหลดไฟล์ขนาดนับร้อยเมกะไบต์ทุกเว็บ และอาจใช้งานฟีเจอร์ต่างๆ ของเครื่องเช่น GPU หรือ NPU ได้จำกัด การที่เบราว์เซอร์มี API โดยตรงให้เลยจะทำให้ออปติไมซ์ได้ดีขึ้น
เดโมอันหนึ่งที่น่าสนใจจากงาน Google I/O 2024 เมื่อคืนนี้คือการใช้ Gemini ร่วมกับ Google Workspace โดยเดโมที่กูเกิลโชว์บนเวทีคือ การสั่งให้ Gemini ค้นหาอีเมลใบเสร็จทั้งหมดใน Gmail ของเราเอง แล้วรวมไฟล์ใบเสร็จไปบันทึกไว้ใน Google Drive และจัดระเบียบ ทำบัญชีรายจ่ายแยกหมวดให้อัตโนมัติออกมาเป็นไฟล์ Google Sheets สำเร็จรูป
ฟีเจอร์นี้จะเริ่มเปิดทดลองใช้กับกลุ่ม Workspace Labs ภายในเดือนพฤษภาคมนี้ และเปิดใช้กับลูกค้าที่จ่ายพรีเมียม Gemini for Workspace หรือ Google One AI Premium ในเดือนมิถุนายน
เดโมอื่นๆ ที่โชว์คือ Contextual Smart Reply ข่วยเขียนตอบอีเมล โดยอิงจากเนื้อหาในอีเมลฉบับก่อนๆ ฟีเจอร์นี้จะเริ่มเปิดใช้กับกลุ่ม Workspace Labs เดือนกรกฎาคม
กูเกิลประกาศเพิ่มความสามารถด้าน AI ให้กับ Google Photos เรียกรวมว่า Ask Photos โดยสามารถค้นหารูปภาพในคลังของผู้ใช้งานแต่ละคน ด้วยคำถามภาษาธรรมชาติ (natural language)
ตัวอย่างความสามารถด้าน AI ที่ประกาศได้แก่
ฟีเจอร์ Ask Photos จะเปิดให้ใช้งานในรูปแบบฟีเจอร์ทดลอง (experimental) โดยเริ่มเปิดให้ใช้งานได้เร็ว ๆ นี้
กูเกิลโชว์ Gemini Nano โมเดลปัญญาประดิษฐ์สำหรับโทรศัพท์รุ่นใหม่รองรับอินพุตหลายรูปแบบทั้งภาพ, เสียง, และข้อความ พร้อมกับความสามารถของแอป Gemini ที่ผูกเข้ากับระบบของแอนดรอยด์เต็มตัว
Gemini Nano อ่านภาพได้ ทำให้สามารถบรรยายภาพได้โดยไม่ต้องมีข้อมูลล่วงหน้า กูเกิลใส่ความสามารถนี้ในฟีเจอร์ TalkBack ที่ช่วยผู้มองเห็นได้จำกัด ทำให้สามารถบรรยายภาพได้อย่างละเอียด นอกจากนี้ยังสามารถฟังเสียงได้ ทำให้สามารถฟังเสียงการสนทนาตลอดเวลาและแจ้งเตือนทันทีเมื่อพบว่าบทสนนนาน่าจะเป็นการหลอกลวง ฟีเจอร์นี้จะเป็นแบบ opt-in ต้องเปิดใช้งานเอง และจะเปิดให้ใช้ภายในปีนี้ (ไม่ระบุประเทศที่รองรับ)
กูเกิลอัพเดต Gemini Advanced เวอร์ชั่นผู้ใช้ทั่วไป เป็น Gemini 1.5 Pro ทำให้รองรับ context window ขนาด 1 ล้านโทเค็นแบบเดียวกับการใช้งานแบบเดียวกับการใช้งานผ่าน API รองรับการอัพโหลดข้อมูลขนาดใหญ่เข้าไปยังแชตได้โดยตรง โดยมีฟีเจอร์ใหม่หลักๆ ได้แก่
กูเกิลอัพเดตโมเดล Gemini 1.5 Pro โดยขยาย context window เป็น 2 ล้านโทเค็น ทำให้สามารถรองรับข้อมูลขนาดใหญ่มาก และเชื่อฟังคำสั่งมากขึ้น โดยเฉพาะคำสั่งฟอร์แมต์เอาท์พุต หรือพฤติกรรมของ AI และการวางแผนการทำงานได้ดีขึ้นทำให้สามารถเรียกฟังก์ชั่นภายนอกได้มากขึ้น
นอกจากนี้กูเกิลยังเปิดตัว Gemini 1.5 Flash ที่ราคาประหยัดลงแต่ประสิทธิภาพยังใกล้เคียง Gemini 1.5 Pro โดยอาศัยเทคนิค distillation ที่ดึงความสามารถจากโมเดลขนาดใหญ่ และรองรับ context window ขนาด 1 ล้านโทเค็นเท่ากับรุ่นใหญ่ ราคาค่าใช้งาน 0.35 ดอลลาร์ต่อล้านโทเค็น
Gemini 1.5 Pro และ 1.5 Flash เปิดให้ใช้งานได้ทั้งทาง Google AI Studio และ Vertex AI ส่วนเวอร์ชั่น 2 ล้านโทเค็นยังทดสอบวงปิดต้องขอใช้งาน
มีประเด็นต่อเนื่องจากรายงานเรื่อง Siri จะปรับปรุงความสามารถด้วย Generative AI ซึ่งแอปเปิลมีสองแนวทางคือ ใช้ AI พัฒนาเองที่ชื่อ Ajax และร่วมมือกับพาร์ตเนอร์ภายนอกซึ่งมีทั้ง OpenAI และกูเกิล
โดยรายงานล่าสุดของ Mark Gurman แห่ง Bloomberg บอกว่าตอนนี้การเจรจาของแอปเปิลกับ OpenAI มีความคืบหน้ามาก ใกล้ได้ข้อสรุปเพื่อนำ ChatGPT มาเป็นฟีเจอร์หนึ่งใน iOS 18 แล้ว ส่วนการเจรจากูเกิลเพื่อนำ Gemini มาใช้งาน ก็ยังคงดำเนินต่อไป แต่ยังไม่มีข้อมูลว่าไปถึงระดับไหน
กูเกิลเปิดตัว Google Threat Intelligence บริการสารสนเทศความปลอดภัยไซเบอร์แบบครบวงจร ที่รวมร่างผลิตภัณฑ์ด้านความปลอดภัยในเครือกูเกิล ได้แก่ Mandiant (ซื้อมาปี 2022), VirusTotal (ซื้อมาปี 2012) และพ่วงด้วยพลัง Gemini เข้ามาอีกอย่าง
Android Studio ออกรุ่นเสถียร Jellyfish เวอร์ชัน 2023.3.1 (โค้ดเนมตัว J) ตามหลัง Android Studio Iguana เพียงไม่ถึง 2 เดือนเต็ม
ฟีเจอร์ใหม่ในเวอร์ชันนี้ได้แก่
OPPO และ OnePlus ประกาศจับมือกับ Google นำฟีเจอร์จาก Gemini ของ Google สร้างประสบการณ์การใช้งาน AI บนมือถือให้มีฐานผู้ใช้กว้างขึ้นในงาน Google Cloud Next '24 โดยจะรวมผลิตภัณฑ์ AI บนคลาวด์ของ Google เข้ากับอุปกรณ์มือถือต่าง ๆ ทำให้มีฟีเจอร์ AI เช่น การสรุปบทความข่าว, การจัดระเบียบเนื้อหาเสียงแบบเรียลไทม์ และการสร้างเนื้อหาโซเชียลมีเดีย เหมือน Samsung Galaxy S24 ซีรี่ส์ ซึ่งอาจตีความได้ว่าสัญญา Exclusive ของซัมซุงอาจสิ้นสุดแล้ว
กูเกิลเผยแพร่คู่มือ 45 หน้า ว่าด้วยการเขียน Prompt สำหรับการใช้งานแชทบอต Gemini บน Google Workspace ซึ่งสามารถประยุกต์ได้เช่นกัน แม้ไม่ได้ใช่ Gemini เวอร์ชันนี้ โดยคู่มือนี้ชื่อว่า Prompting guide 101 เหมาะสำหรับคนทำงานในฝ่ายต่าง ๆ ที่ต้องการเขียนคำสั่งให้ Gemini ทำงานอย่างที่ต้องการ
กูเกิลอธิบายว่าในการเขียน Prompt ให้พิจารณาถึง 4 องค์ประกอบที่ควรกำหนดเพื่อให้ได้ผลลัพธ์ที่ต้องการ คือ Persona (บอกว่าเราคือใคร), Task (สิ่งที่ต้องการให้ AI ทำ), Context (รายละเอียดประกอบ) และ Format (รูปแบบ)
กูเกิลเปิดตัวบริการ Gemini Code Assist ที่เปลี่ยนชื่อมาจาก Duet AI for Developer แต่เปลี่ยนปัญญาประดิษฐ์ภายในเป็น Gemini ที่อ่านข้อมูลได้นับล้่านโทเค็น ทำให้เวลาแนะนำโค้ดนั้นไม่ใช่การอ่านทีละไฟล์ แต่อ่านทั้งโครงการทีละเป็นแสนบรรทัดและแนะนำได้ทันที
การประกาศรอบนี้ยังประกาศเป็นพันธมิตรกับบริษัทความปลอดภัยซอฟต์แวร์ Synk โดยตอนนี้ยังเป็นเพียงการแนะนำการใช้งาน Synk ในแชตก่อน แต่ภายในปีนี้จะรวมความสามารถในการสแกนโค้ดเข้าไว้ในบริการ Code Assist เลย ทำให้แนะนำช่องโหว่ในโค้ดได้ทันที
Gemini Code Assist เปิดให้ใช้ฟรีแล้ววันนี้ แต่จะเก็บเงินหลังวันที่ 11 มิถุนายนนี้ ราคา 19 ดอลลาร์ต่อคนต่อเดือน สามารถใช้งานได้บน VS Code และ JetBrains
นอกเหนือจาก Google Vids แอปสร้างวิดีโอจากเอกสารใน Google Docs และ Google Sheets กูเกิลยังประกาศฟีเจอร์ใหม่พลัง Gemini หลายอย่างสำหรับคนใช้งาน Google Workspace มีรายละเอียดดังนี้
กูเกิลเปิด Gemini 1.5 Pro ให้คนทั่วไปใช้งานแล้ว หลังจากเปิดตัวแบบจำกัดเมื่อเดือนกุมภาพันธ์ที่ผ่านมา พร้อมกับเพิ่มฟีเจอร์ค้นหาข้อมูลอ้างอิง (grounding) ทั้งการค้นด้วย Google Search และการค้นข้อมูลภายในองค์กรเอง
สำหรับการค้นข้อมูลในองค์กร เดิม Vertex AI มีบริการ Enterprise Search อยู่แล้ว ตอนนี้เพิ่มความสามารถเชื่อมต่อกับฐานข้อมูลภายนอก เช่น AlloyDB หรือ BigQuery เข้ามาเพิ่ม และยังเชื่อมต่อแอปที่องค์กรใช้งานอยู่ เช่น Workday, Salesforce, ServiceNow, Hadoop, Confluence, และ JIRA
กูเกิลปล่อยโมเดลปัญญาประดิษฐ์ LLM สำหรับเขียนโค้ดในชื่อ CodeGemma เน้นใช้งานเป็นตัวช่วยเขียนโค้ดโดยเฉพาะ โดยมีโมเดล 3 รุ่น ได้แก่
กูเกิลประกาศนำโมเดล Gemini 1.0 Pro มาใส่ในเครื่องมือสำหรับนักพัฒนา Android Studio พร้อมรีแบรนด์ Studio Bot ที่เป็น AI ช่วยการเขียนโค้ด ในชื่อใหม่ Gemini in Android Studio เพื่อให้ทิศทางผลิตภัณฑ์ AI ของกูเกิลเป็นไปในทิศทางเดียวกันทั้งหมดภายใต้แบรนด์ Gemini
Gemini in Android Studio เป็นผู้ช่วยการเขียนโค้ดซึ่งสามารถเรียกใช้งานได้โดยตรงใน IDE กูเกิลบอกว่าทำให้การพัฒนาโค้ดคุณภาพสูง ทำได้รวดเร็วขึ้น ช่วยแก้ไขปัญหาโค้ดที่ซับซ้อน สามารถถาม-ตอบ ตลอดจนเพิ่มคอมเมนต์และค้นหาข้อมูลที่ต้องการได้ ตอนนี้มีให้ใช้งานแล้วใน Android Studio Jellyfish
แชทบอต AI Gemini ของกูเกิล น่าจะมีจุดแข็งหนึ่งคือการทำงานร่วมกันกับบริการต่าง ๆ ของกูเกิล ที่มีฐานผู้ใช้งานสูงอยู่แล้ว ล่าสุดกูเกิลเลยเชื่อมต่อคำตอบของ Gemini กับ Google Maps หากเป็นคำถามเกี่ยวกับการขอเส้นทาง
โดยหากถาม Gemini เช่น บอกเส้นทางไปยัง... หรือ พาฉันไปที่... (ที่ทดสอบตอนนี้ยังได้เฉพาะภาษาอังกฤษ) Gemini จะให้คำตอบทั้งระยะเวลาและระยะทาง รวมทั้งแนบเส้นทางบน Google Maps เพื่อใช้ดูเพิ่มเติม
นอกจากการขอเส้นทางแล้ว Gemini บน Android ยังเพิ่มความสามารถช่วยตั้งเตือน หรือกำหนดนัดหมายในปฏิทินได้ด้วย โดยผู้ใช้งานต้องเปิดการทำงานของส่วนขยาย Workspace
ที่มา: 9to5Google