ในงาน Google I/O 2024 เมื่อคืนนี้ ทีม Google DeepMind ได้โชว์เดโมของ Project Astra โครงการผู้ช่วยส่วนตัว AI ที่สามารถสนทนากับผู้ใช้อย่างต่อเนื่อง ตอบคำถามสิ่งต่างๆ เกี่ยวกับสิ่งที่มองเห็นผ่านกล้องมือถือ ตัวอย่างคือการยกมือถือออกไปถ่ายนอกหน้าต่าง แล้วถามว่าเราอยู่ที่ไหน ซึ่ง Astra ก็ตอบได้อย่างถูกต้อง
Astra ยังมีความสามารถเรื่องความจำ (memory) โดยตอบคำถามผู้เดโมได้ว่า แว่นตาอยู่ที่ไหน ซึ่ง Astra ตอบได้จากการที่เห็นภาพแว่นตาผ่านเข้ามาในกล้องช่วงก่อนหน้า
ครึ่งหลังของเดโมเป็นการใช้แว่นตาติดกล้อง ลักษณะเดียวกับ Google Glass แล้วให้ Astra ช่วยตอบคำถามของสิ่งที่เขียนบนกระดานไวท์บอร์ด กูเกิลบอกว่าเดโมนี้ถ่ายมาให้ดูแบบต่อเนื่อง single take และเป็นการเดโมแบบเรียลไทม์ ตัวปัญญาประดิษฐ์อิงอยู่บน Gemini แต่เพิ่มฟีเจอร์ด้านการประมวลผลเฟรมวิดีโอ และการสร้าง timeline ของเหตุการณ์ต่างๆ เข้ามาเพื่อช่วยเรื่องความจำ (recall)
หากใครดูเดโมของ GPT-4o ของฝั่ง OpenAI คงนึกภาพออกว่า Astra คือผลิตภัณฑ์แบบเดียวกัน แต่กูเกิลยังไม่เผยรายละเอียดว่า Astra จะได้ใช้งานจริงๆ กันเมื่อไร
ที่มา - Google
Comments
จะว้าวมาก ถ้าไม่โดน openai เปิดตัวตัดหน้า
แถมเจ้านั้นเขาเปิดให้ใช้เลยด้วย
แต่เทรนด์น่าจะไปทางนี้ล่ะ (ฟัง+มอง) ใครยังทำไม่ได้น่าจะโดนทิ้ง
มิน่าว่า apple ถึงเลือกทาง “ซื้อ” มาใช้
นี่เลยเบรคไม่ซื้อ homepod เพราะกลัวว่าจะมีรุ่นใหม่แล้วรุ่นเก่าใช้ chatGPT ไม่ได้
ข่าวต่อไป: Apple ผนวก GPT-4o เข้ากับ Siri ใน iOS 18
apple ตอนนี้ ตามไม่ทันแล้ว
ว่าแต่ MS ซื้อ OPEN AI ไปนี่ ใช้คุ้มแล้วปะ หรือว่ายังเป็นแค่ส่วนน้อยอำนาจต่างๆ ยังอิสระอยู่ อยากดีลกับ แอปเปิ้ลก้ทำได้ เอา gpt ใส่ไว้บน mac งี้
ไมโครซอฟท์ไม่ได้ซื้อ OpenAI ครับ ลงทุนในนั้นเฉย ๆ
Coder | Designer | Thinker | Blogger
OpenAI มีกำไรแล้วมีการปันผล Microsoft ก็ได้ด้วย แต่ที่สำคัญคือ การที่ Microsoft ได้เข้าถึงข้อมูลทางเทคนิคของ OpenAI เช่นกัน นั่นหมายถึงทั้งสองบริษัทอิสระต่อกัน วันหนึ่ง Microsoft อาจไปสร้าง Model ของตัวเอง หรือ OpenAI จะไปจับมือกับใครก็ได้ (โดย Microsoft เห็นชอบด้วย) ถ้าดูตามนี้ Microsoft ก็ไม่ได้มีผลเสียอะไรนะครับ
ถ้าเป็นบริษัทใหญ่ ขับเคลื่อนช้า วิธีที่นักบริหารมักใช้เวลาที่ตามคู่แข่งไม่ทัน คือ ซื้อ หรือลงทุนในบริษัทอื่นมาคั่นเวลาก่อนเพื่อไม่ให้ถูกทิ้งไกล แล้วระหว่างที่ถ่วงเวลานั้นก็พัฒนาของตัวเองเพื่อเร่งตามให้ทัน โดยใช้เงินสดที่ตัวเองมีสะสมเป็นจำนวนมากจากการเป็นเจ้าตลาด (ซื้อเพื่อฆ่าทิ้งเอาคนและเทคโนโลยี นั่นคือคำที่เราคุ้นเคย) นี่แหล่ะครับ Logic ของนักบริหาร เขาจะคิดต่างจากพวกเราพอสมควร เขาจะมองว่าเงิน อำนาจ เป็นเครื่องมือหนึ่งเช่นกัน แล้วก็ไม่ได้มองว่าทุกอย่างต้องพัฒนาเองทั้งหมด
คนเป็นผู้บริหารต้องมีจิตใจที่เข้มแข็งพอสมควรเลยแหล่ะครับ ทั้งเรื่องเผาเงินมหาศาล ความล้มเหลวของโครงการ การจัดการทรัพยากรให้เหมาะสมกับขนาดองค์กรซึ่งมันต้องทำร้ายจิตใจคนจำนวนมาก ในบางองค์กรก็เลยมีผู้บริหารสายเทพ กับผู้บริหารสายมาร เพื่อ balance ความรู้สึกคนในองค์กร แต่จริงๆ แล้วเขาก็รู้กันอยู่แล้วแหล่ะครับ ว่ากำลังทำอะไรอยู่ แต่เล่นคนละบทบาท
กรณีของ AI เนี่ย ผมว่า Google เก่งใช้ได้เลยนะ ที่พัฒนา Gemini ไล่ตามขึ้นมาได้เร็วขนาดนี้ ถึง MS จะมี OpenAI ในมือ แต่ก็ไม่สามารถควบคุมได้ 100% ต่างจาก Google ที่ทำเอง
..: เรื่อยไป
Google มี ecosystem ของตัวเอง จักรวาล android by google รุ่งแน่ ๆ มี chrome + chromebook ส่วน MS ได้แต่ทำใจ หันไปจักรวาล windows ที่เหลืออยู่ที่ไม่มีมือถือ
บล็อก: wannaphong.com และ Python 3