OpenAI เปิดเผยว่าบริการแชทบอตปัญญาประดิษฐ์ ChatGPT มีผู้ใช้งานเป็นประจำทุกสัปดาห์ (Weekly Active Users) มากกว่า 200 ล้านบัญชีแล้ว ซึ่งตัวเลขเพิ่มมาเท่าตัวจากที่ OpenAI รายงานตัวเลข 100 ล้าน เมื่อเดือนพฤศจิกายนปีที่แล้ว
ตัวเลขอาจพอบอกได้ว่า ChatGPT ยังมีการเติบโต และเป็นผู้นำในตลาดแชทบอต Generative AI แม้ในภาพรวมจะมีการแข่งขันจากผู้เล่นรายอื่น ซึ่งรวมทั้งบริษัทเทคโนโลยีขนาดใหญ่ GPT-4o mini
Midjourney ผู้พัฒนาเครื่องมือสร้างรูปภาพด้วย AI ประกาศว่าบริษัทเตรียมเข้าสู่ธุรกิจฮาร์ดแวร์ พร้อมรับสมัครพนักงานที่สนใจเข้าร่วมทีม โดยยังไม่ได้เปิดเผยรายละเอียดว่าฮาร์ดแวร์ที่ว่าคืออะไร หรือจะเสริมกับ AI สร้างรูปภาพอย่างไร
อย่างไรก็ตามการพัฒนาฮาร์ดแวร์อาจไม่ใช่เรื่องที่นอกกรอบสำหรับ Midjourney เพราะผู้ก่อตั้ง David Holz ก็เคยเป็นซีทีโอที่ Leap Motion และ Midjourney ก็เพิ่งรับ Ahmad Abbas อดีตพนักงาน Leap Motion ที่ย้ายไปทำงานที่แอปเปิลในแผนกฮาร์ดแวร์อยู่ 5 ปี ในฝ่าย Vision Pro มาเข้าร่วมทีมในตำแหน่งหัวหน้าฝ่ายฮาร์ดแวร์
NVIDIA เผยผลเบนช์มาร์คแรกของจีพียู Blackwell B200 โดยเป็นเบนช์มาร์ค MLPerf Inference: Datacenter ที่นิยมใช้กันในวงการ AI ทดสอบกับโมเดล Llama 2 70B ผลคือได้ประสิทธิภาพต่อจีพียูสูงกว่าชิป H100 (Hopper) ประมาณ 4 เท่าตัว
ผลการทดสอบของ NVIDIA ใช้เครื่องซีพียู Xeon Silver 4410Y ร่วมกับชิป B200 แรม 180GB ได้คะแนนออกมาดังนี้
DeepMind นำเสนอโมเดล GameNGen เกมเอนจินที่จำลองเกมได้สมจริงเหมือนการเล่นเกมจริงๆ แต่ภายในเป็นโมเดลสร้างภาพ Stable Diffusion ถูกฝึกด้วยภาพเกมและการคอนโทรลต่างๆ
โมเดลนี้อาศัยการสร้าง Agent ที่เล่นเกมจริงแล้วเก็บภาพที่ได้และการกระทำของผู้เล่นในเกม (เดิน ยิง วิ่ง) ไว้ต่อเนื่อง จากนั้นนำภาพและการกระทำมาฝึก generative model ให้ทำนายเฟรมต่อไปจากเฟรมเริ่มต้น ทำให้สุดท้ายได้โมเดลที่แทนเกมเอนจินได้ สามารถควบคุมและเล่นได้จริง ตัวโมเดลมีความสามารถในการนับพลังหรือจำนวนกระสุน ทีมงานพบว่าระหว่างการฝึก จำเป็นต้องแทรกภาพขยะเข้าไประหว่างทางด้วย เพื่อให้โมเดลทำงานได้นิ่งขึ้น
นอกจากประกาศอัปเดตเครื่องมือสร้างแชทบอตคัสตอม Gems แล้ว กูเกิลยังประกาศอย่างเป็นทางการเกี่ยวกับ Imagen 3 เครื่องมือสร้างรูปภาพจากข้อความ (Text-to-Image) รุ่นใหม่ ที่มีรายงานว่าเริ่มเปิดให้ใช้งานเมื่อสัปดาห์ที่แล้ว
โดยนอกจาก Imagen 3 จะรองรับการสร้างรูปที่มีคุณภาพสูงขึ้น ละเอียดมากขึ้น และสมจริงมากขึ้น รวมทั้งรองรับระบบลายน้ำ SynthID เหมือนใน Imagen 2 แล้ว Imagen 3 จะกลับมาให้ผู้ใช้งานสร้างรูปภาพบุคคลได้อีกครั้ง หลังจากกูเกิลปิดการทำงานส่วนนี้ไปตั้งแต่ต้นปีที่ผ่านมา เพราะพบปัญหาการสร้างรูปภาพที่ไม่ถูกต้อง
กูเกิลประกาศว่า Gems เครื่องมือสร้างแชทบอต AI แบบคัสตอม สามารถกำหนดรูปแบบที่ต้องการได้เองเหมือนกับ GPTs ของ OpenAI เริ่มอัปเดตให้กับลูกค้า Gemini Advanced, Business และ Enterprise รองรับมากกว่า 150 ประเทศ ตั้งแต่วันนี้เป็นต้นไป
กูเกิลเปิดตัว Gems ในงาน Google I/O เมื่อเดือนพฤษภาคม โดย Gems สามารถกำหนดค่าเป็นผู้เชี่ยวชาญเฉพาะเรื่อง หรือมีความสามารถเจาะจงเฉพาะสิ่งที่ต้องการ กูเกิลยังเพิ่มค่าตั้งต้นของ Gems ให้การเริ่มใช้งานทำได้ง่ายขึ้น เช่น เป็นผู้เชี่ยวชาญเฉพาะหัวข้อ, เป็นคนตรวจสอบไวยากรณ์, เป็นผู้ตรวจสอบโค้ด เป็นต้น
Plaud บริษัทฮาร์ดแวร์ปัญญาประดิษฐ์ เปิดตัวสินค้าใหม่ NotePin อุปกรณ์ขนาดเล็กรูปทรงแคปซูล ที่เป็นเครื่องบันทึกเสียงพลัง AI สามารถพกติดตัวไปกับผู้ใช้งานได้ตลอดทั้งวัน
NotePin ทำหน้าที่บันทึกเสียงในเวลาต่าง ๆ แล้วทำการถอดข้อความ สรุปเนื้อหาด้วย AI เหมือนมีผู้ช่วยคอยจดบันทึก หรือมองว่าเป็นสมองช่วยจดจำทุกอย่างให้ก็ได้ แบตเตอรีอยู่ได้นาน 20 ชั่วโมง อย่างไรก็ตามการบันทึกเสียงจะไม่ได้ทำงานตลอดเวลา ต้องแตะอุปกรณ์เพื่อเริ่มการบันทึกเสียงก่อน
กูเกิลประกาศปล่อยฟีเจอร์ “take notes for me” ที่ให้ Gemini ช่วยสรุปการประชุมใน Google Meet อัตโนมัติ ประชุมเสร็จแล้วสามารถแปลงไฟล์สรุปประชุมไปลง Google Docs ได้ด้วย
ฟีเจอร์แนวนี้ไม่ใช่ของใหม่ เพราะปี 2023 กูเกิลเคยทำฟีเจอร์ Duet AI สรุปประชุม Meet มาก่อน เพียงแต่รอบนี้อัพเกรดตัวโมเดลเป็น Gemini ที่มีความสามารถมากขึ้น วิธีการใช้งานคือมีปุ่ม Gemini โผล่มาตรงมุมขวาบน กดแล้วสั่งให้ Gemini ช่วยฟังการประชุมพร้อมจดโน้ตได้เลย
ฟีเจอร์นี้ยังใช้งานได้เฉพาะบนคอมพิวเตอร์ รองรับเฉพาะภาษาอังกฤษเท่านั้น และจำเป็นต้องซื้อแพ็กเกจพรีเมียม Gemini Enterprise หรือซื้อส่วนขยาย AI Meetings & Messaging จากแพ็กเกจปกติ
Cerebras บริษัทชิปปัญญาประดิษฐ์ เปิดบริการ Cerebras Inference รันโมเดล Llama 3.1 ที่ความเร็วสูง โดยสามารถรัน Llama 3.1 70B ที่ 450 token/s ขณะที่ Llama 3.1 8B ได้ถึง 1,800 token ต่อวินาที นับว่าเป็นบริการที่ความเร็วสูงที่สุดในโลกในตอนนี้ จากเดิมที่ Groq ทำได้ที่ 750 token/s
จุดขายของ Cerebras คือชิป Wafer Scale Engine ที่ใส่ SRAM ความเร็วสูง 44GB อยู่บนตัวชิป เชื่อมต่อกับหน่วยประมวลผลที่แบนวิดท์รวมสูงถึง 21 Petabytes/s เทียบกับชิป NVIDIA H100 ที่แม้แบนวิดท์จะสูงแล้วแต่ก็ได้เพียง 3.3 Terabytes/s แนวทางนี้มีความจำเป็นสำหรับการรันโมเดลให้มีความเร็วเนื่องจากข้อมูลแต่ละ token จะต้องผ่านโมเดลทั้งหมด เช่นโมเดล 70B การรันโมเดลให้ได้ 1000 token/s จะต้องการแบนวิดท์ถึง 140 Terabytes/s
NVIDIA โชว์การปรับปรุงโมเดลภาษา Mistral NeMo 12B ที่เปิดตัวในเดือนกรกฎาคม ให้มีขนาดพารามิเตอร์ลดลงเหลือ 8B แต่ไม่สูญเสียประสิทธิภาพมากนัก ผลคือโมเดล Mistral-NeMo-Minitron 8B ที่ปรับขนาดลดลงแล้ว เอาชนะโมเดลคู่แข่งระดับใกล้เคียงกันอย่าง Llama 3.1 8B และ Gemma 7B ในเบนช์มาร์ค AI ทุกตัวได้
เทคนิคการปรับลดขนาดโมเดลที่ NVIDIA ใช้งานมี 2 อย่าง ได้แก่
TechCrunch รายงานความคืบหน้าของบริษัท Inflection AI ที่โดนไมโครซอฟท์ดึงตัวซีอีโอ Mustafa Suleyman และทีมงานส่วนหนึ่งไปเมื่อเดือนมีนาคม 2024
Sean White ซีอีโอคนใหม่ของ Inflection ให้สัมภาษณ์ยอมรับว่า ทรัพยากรของบริษัทมีน้อยลง จึงไม่สามารถให้บริการแชทบอท Pi ได้อิสระเหมือนเดิม เพราะทุกการแชทคือทรัพยากรจีพียูที่สิ้นเปลือง ตอนแรก Inflection เตรียมปิด Pi ไปเลย แต่เปลี่ยนใจมาเป็นการจำกัดจำนวนการแชทแทน
Elon Musk ออกมาแสดงความเห็นด้วยกับร่างกฎหมายควบคุมปัญญาประดิษฐ์ของรัฐแคลิฟอร์เนีย หรือ SB 1047 พร้อมกับระบุว่าเขาสนับสนุนการกำกับปัญญาประดิษฐ์มานานแล้ว
เขาเป็นผู้บริหารบริษัทปัญญาประดิษฐ์รายใหญ่รายที่สองที่ออกมาแสดงความเห็นด้วย โดยสัปดาห์ที่แล้วมี Dario Amodei ซีอีโอ Anthropic ออกมาแสดงความเห็นด้วยแบบเดียวกัน
แม้จะมีนักวิจัยและบริษัทต่างๆ ออกมาแสดงความไม่เห็นด้วยกับกฎหมายนี้อย่างหนักในช่วงต้น แต่ร่างกฎหมายก็มีการปรับแก้ไปหลายส่วน โดยเฉพาะการตั้งกรรมการควบคุมการพัฒนาปัญญาประดิษฐ์ที่ถูกวิจารณ์หนักและถอนออกไปในร่างหลังๆ
กูเกิลเริ่มปล่อยฟีเจอร์ใหม่ "Help me create a list" ของ Google Keep ที่ให้ Gemini ช่วยสร้างลิสต์สิ่งที่ต้องทำให้เราได้
ตัวอย่างการใช้งานคือ เราสามารถสั่ง Gemini ให้สร้างรายการซื้อของสดสำหรับครอบครัว 4 คน ใช้เป็นเวลา 1 สัปดาห์ ซึ่ง Gemini จะร่างรายการซื้อผักสด ผลไม้สด เนื้อ ปลา นม ขนมปัง ฯลฯ มาให้เราอัตโนมัติ หากโอเคแล้วก็กดปุ่มเพื่อสร้างเป็นรายการ list ใน Google Keep ได้ทันที
9to5google รายงานว่าฟีเจอร์นี้ทยอยปล่อยให้มือถือหลายรุ่นใช้งานแล้ว โดยใช้ฟรีบนมือถือกลุ่ม Pixel แบบจำกัดจำนวนครั้ง แต่ถ้าเป็นมือถือ Android รุ่นอื่นๆ หรืออยากใช้แบบไม่จำกัดบน Pixel จำเป็นต้องสมัครแพ็กเกจ Google One AI Premium
Andy Jassy ซีอีโอ Amazon โพสต์เนื้อหาใน LinkedIn เพื่อนำเสนอความสามารถของระบบผู้ช่วยปัญญาประดิษฐ์สร้างเนื้อหา Amazon Q ที่มีจุดขายหนึ่งสำหรับลูกค้าองค์กรคือการแก้ไขโค้ด และรองรับการย้ายโค้ด Java ไปเวอร์ชันใหม่
เขาบอกว่างานอัปเกรดพื้นฐานซอฟต์แวร์นั้นเป็นสิ่งจำเป็นมาก แต่ไม่ใช่งานที่จูงใจคนทำงานสายนักพัฒนามากนัก เพราะไม่ได้เป็นการสร้างสิ่งใหม่ Amazon Q จึงมีประโยชน์มากเพราะเข้ามาช่วยลดภาระ โดย Amazon ได้นำ Amazon Q มาช่วยในการอัปเกรดโค้ดโปรแกรมที่ใช้ภายใน ให้รองรับ Java เวอร์ชันใหม่
Andrew Ng ประกาศลงจากตำแหน่งซีอีโอของ LandingAI บริษัทปัญญาประดิษฐ์ที่เขาก่อตั้ง ซึ่งเน้นการทำงานร่วมกับภาคการผลิต โดยไปรับตำแหน่งประธานบริษัทแทน
ซีอีโอคนใหม่ที่แต่งตั้งคือ Dan Maloney ซึ่งปัจจุบันเป็นซีโอโอของ LandingAI โดยเขามาร่วมงานกับบริษัทได้ 2 ปี และขยายบริการปัญญาประดิษฐ์ให้ลูกค้าได้เพิ่มขึ้นมาก จึงเป็นเวลาที่เหมาะสมในการส่งต่อตำแหน่ง โดย Ng จะยังอยู่ช่วยในการตัดสินใจเรื่องสำคัญต่อไป
ที่มา: LandingAI
Midjourney ประกาศเปิดให้บริการเวอร์ชันเว็บแบบเต็มตัวแล้ว หลังจากทดลองเวอร์ชันอัลฟ่ามาตั้งแต่ปลายปีที่แล้ว โดยต้องใช้บัญชี Google หรือ Discord ในการลงทะเบียนและล็อกอิน
นอกจากนี้เวอร์ชันทดลองใช้ฟรียังกลับมาแบบชั่วคราวด้วยเช่นกัน หลังจากยกเลิกไปเมื่อต้นปีที่แล้ว โดยเวอร์ชันทดลองใช้สามารถเจนรูปภาพได้สูงสุด 25 รูป
ส่วนแพ็กเกจของ Midjourney มีตั้งแต่เดือนละ 10 เหรียญ เจนรูปได้ 200 รูป, เจนพร้อมกันได้สูงสุดทีละ 3 รูป และใช้เวลา GPU ได้ 3.3 ชม. ต่อเดือน ไปจนถึงสูงสุดที่ 120 เหรียญ ไม่จำกัดรูป เจนรูปพร้อมกันได้ 12 รูปและใช้ GPU ได้ 60 ชม. ต่อเดือน
Google เปิดตัว Pixel 9 ที่มาพร้อมฟีเจอร์ใหม่หลายรายการ เช่น Gemini Live, Call Notes, Pixel Screenshot รวมถึง Pixel Studio ที่เป็นฟีเจอร์ AI สร้างรูปภาพแบบทำงานบนตัวเครื่อง (ไม่เหมือน Imagen 3 ที่ทำงานบนคลาวด์)
ล่าสุดมีคนพบปัญหาว่า Pixel Studio ยังมีช่องโหว่ให้สร้างภาพที่ไม่เหมาะสมได้ แม้ทาง Google จะไม่เปิดให้สร้างรูปภาพบุคคล แต่ก็สามารถสร้างภาพตัวละครในการ์ตูนได้
เช่น ภาพ SpongeBob สวมชุดทหารเยอรมนีในช่วงสงครามโลกครั้งที่สอง หรือภาพปิกาจูสวมแว่นดำคาบบุหรี่ถือปืน อย่างไรก็ตาม Google ได้แก้ไขปัญหานี้แล้ว โดยเฉพาะการสร้างรูปภาพที่อ่อนไหวเป็นอย่างมาก
เรื่องนี้เป็นกรณีศึกษาการนำเทคโนโลยีมาใช้แก้ปัญหากับรถไฟในอังกฤษ โดยบริษัท LNER ซึ่งดำเนินการเดินรถไฟในอังกฤษ เปิดเผยผลการทดสอบติดตั้งระบบป้องกันอันตรายที่ Stoke Junction และได้ขยายจุดติดตั้งเพิ่มเติม โดยมีเป้าหมายเพื่อลดการเสียชีวิตของกวาง
ระบบดังกล่าวใช้ AI ในการแยกแยะวัตถุที่ตรวจพบ โดยหากพบกวางเดินเข้ามาใกล้รางรถไฟก็จะส่งเสียงสัญญาณเตือน จนกว่ากวางจะเดินห่างออกไปจากรางรถไฟในระยะที่ปลอดภัย หลังจากติดตั้งอุปกรณ์มาหนึ่งปี พบว่าการแจ้งเตือนนี้ลดการสููญเสียได้เกือบ 6 พันครั้ง ทำให้การรถไฟของอังกฤษมีแผนติดตั้งอุปกรณ์นี้เพิ่มเติมในอนาคต
กูเกิลปรับปรุงความสามารถของฟีเจอร์ "Help me write" ที่ใช้ Gemini AI ช่วยเขียนอีเมลใน Gmail โดยมีของใหม่ดังนี้
เดิม Help me write มีตัวเลือกในการปรับแก้ไขอีเมลที่เขียนไว้ได้แก่ Formalize (ทางการ), Elaborate (ขยายความ) และ Shorten (ย่อความ) ในอัปเดตนี้กูเกิลเพิ่มตัวเลือกใหม่คือ Polish ที่เป็นการปรับแต่งข้อความที่ใช้ให้สวยงามขึ้น
นอกจากนี้กูเกิลยังเพิ่มทางลัดในการเรียกใช้ Help me write สำหรับ Gmail บน iOS และ Android โดยมีปุ่มให้เลือกในหน้าร่างจดหมาย และเมื่อเริ่มพิมพ์ร่างจดหมายไปอย่างน้อย 12 คำ จะปรากฏแท็บ Refine my draft เพื่อเรียกใช้คำสั่งปรับแก้ไขอีเมลในรูปแบบต่าง ๆ ที่ต้องการ
OpenAI ประกาศความร่วมมือกับบริษัทสื่อรายล่าสุดคือ Condé Nast เจ้าของนิตยสารหลายฉบับในสหรัฐ เช่น Vogue, The New Yorker, GQ, Vanity Fair, Wired, Architectural Digest และอื่น ๆ เพื่อแสดงเนื้อหาจากนิตยสารเหล่านี้ผ่านบริการของ OpenAI ทั้ง ChatGPT และต้นแบบของ SearchGPT ซึ่งดีลนี้ไม่มีการเปิดเผยมูลค่า
OpenAI บอกว่าหลังจากเปิดตัว SearchGPT ต้นแบบ ซึ่งรองรับการแสดงผลข้อมูลจากแหล่งต้นทางที่น่าเชื่อถือ และรวดเร็วตามเวลา จึงต้องเชื่อมต่อกับแหล่งข่าวต่าง ๆ พร้อมให้ข้อมูลเชิงลึก ฟีเจอร์เหล่านี้จะถูกนำมาเพิ่มเติมใน ChatGPT ด้วยในอนาคต
Google เปิดให้ใช้ฟีเจอร์ Zoom Enhance ปรับความคมชัดให้ภาพถ่ายระยะใกล้ บน Google Pixel 8 Pro และ Google Pixel 9 Series ที่เพิ่งเปิดตัวไปทุกรุ่น
Zoom Enhance ต่างจาก Super Res Zoom (ที่เป็นการซูมแบบดิจิทัล) ตรงที่ฟีเจอร์นี้เป็นการปรับความคมชัดหลังถ่ายภาพออกมาด้วย diffusion model แบบ image-to-image ซึ่งทำงานบนอุปกรณ์ จึงเป็นเหตุผลที่ทำให้ใช้บน Google Pixel 8 ที่มี RAM 8GB ไม่ได้
วิธีการใช้ฟีเจอร์นี้คือเมื่อถ่ายภาพเสร็จก็กด Edit > Tools > Zoom Enhance โดยฟีเจอร์นี้ยังใช้ปรับความคมชัดให้กับภาพที่ไม่ได้ถ่ายด้วย Google Pixel ได้ หรือแม้แต่ภาพที่สร้างโดย AI ก็ยังทำได้
Procreate แอปวาดภาพยอดนิยมบน iPad ประกาศจุดยืน หลังจากผู้ใช้งาน Procreate แสดงความกังวลว่า ที่สุดแล้วแอปก็จะต้องเข้าสู่กระแสเพิ่มฟีเจอร์ด้าน Generative AI ด้วย ซึ่ง Procreate บอกว่าจะไม่เป็นเช่นนั้น
James Cuda ซีอีโอ Procreate โพสต์วิดีโอใน X บอกว่า Procreate จะไม่มีฟีเจอร์เกี่ยวกับ Generative AI ออกมาในแอป เขายังบอกว่าไม่ชอบสิ่งที่เกิดขึ้นในอุตสาหกรรมตอนนี้ ไม่รู้ว่าตอนจบจะเป็นอย่างไร แต่ยืนยันที่จะอยู่ข้างมนุษย์ผู้สร้างสรรค์ผลงาน
ก่อนหน้านี้ OpenAI ได้เปิดตัว SearchGPT ซึ่งเป็นบริการค้นหาข้อมูลแบบเรียลไทม์จากอินเทอร์เน็ตพลัง AI ที่หลายคนมองว่าทำให้การแข่งขันกับกูเกิลดูเข้าใกล้มากขึ้น อย่างไรก็ตาม SearchGPT เป็นบริการสถานะต้นแบบ ที่ใครต้องการต้องลงชื่อ waitlist ก่อน
ล่าสุดคนที่สมัครรอใน waitlist แต่ยังไม่ได้คำเชิญทดสอบใช้งาน ต่างได้รับอีเมลจาก OpenAI โดยบอกว่าตอนนี้ผู้ใช้งานที่ยังไม่ได้รับคำเชิญ ก็จะต้องรอต่อไปก่อน ซึ่งหากบริการขยายจำนวนผู้ใช้งานก็จะแจ้งอีกครั้ง ในหน้าสมัคร waitlist ตอนนี้ก็ปิดรับสมัครเพิ่มเติมด้วย
Grok AI โมเดล LLM ของ xAI ที่ Elon Musk เป็นเจ้าของ ตกเป็นข่าวว่าเปิดให้ผู้ใช้นำไปสร้างภาพไม่เหมาะสมได้ง่าย ไม่เหมือนคู่แข่งอย่าง Midjourney หรือ Dall-E ที่รัดกุมกว่า
The Verge พบว่ามีผู้ใช้หลายคนนำ Grok AI ไปใช่สร้างรูปภาพที่ไม่เหมาะสม เช่น ภาพคนดังในสถานการณ์หมิ่นเหม่ ภาพตัวละครติดลิขสิทธิ์ ตลอดจนภาพที่มีเนื้อหารุนแรง ปัญหานี้ดูเหมือนจะแก้กันไปแล้วตั้งแต่วันที่ 16 สิงหาคม แต่ยังไม่มีการแถลงออกมาเป็นทางการ
เรื่องนี้กลายเป็นประเด็นพอสมควร เพราะสหรัฐฯ กำลังอยู่ในช่วงการเลือกตั้ง แถมเมื่อไม่นานมานี้ Grok AI เพิ่งตกเป็นข่าวว่าได้แพร่ข้อมูลเท็จเกี่ยวกับการเลือกตั้งอกีด้วย
ปัญญาประดิษฐ์ตอนนี้สามารถทำความเข้าใจภาพ-เสียงได้เป็นอย่างดี แต่ประสาทสัมผัสหนึ่งที่คอมพิวเตอร์และ AI ยังเข้าไม่ถึงอย่างน้อยก็ตอนนี้คือการดมกลิ่น
Osmo เป็นสตาร์ทอัปที่ก่อตั้งโดย Alex Wiltschko และเขาก็เป็นซีอีโออยู่ มีเป้าหมายคือพัฒนาเทคโนโลยี AI ที่สร้างกลิ่นตามเงื่อนไขได้แบบที่เราใช้ AI สร้างภาพและข้อความเสียง
Wiltschko เป็นผู้เชี่ยวชาญด้านระบบประสาทวิทยาการดมกลิ่น เขาจบปริญญาเอกด้านนี้จาก Harvard University และทำงานเป็นนักวิจัยที่ฝ่าย Google Research โดยตอนนั้นงานของเขาคือการพัฒนา Machine Learning ที่สามารถคาดเดากลิ่นที่เกิดขึ้นจากโครงสร้างโมเลกุลที่ระบุ ซึ่งต่อมาเขาก็ลาออกมาก่อตั้ง Osmo ในปี 2022