Hyung-Tae Kim ผู้กำกับเกม Stellar Blade เคยให้สัมภาษณ์ไว้ว่าได้แรงบันดาลใจมาจากเกม NieR: Automata ที่เป็นโลกอนาคตหลังหายนะ และใช้ตัวละครหญิงสไตล์อนิเมกวัดแกว่งดาบต่อสู้กับศัตรู
IGN Japan มีโอกาสสัมภาษณ์ Yoko Taro ผู้กำกับของเกม NieR: Automata ที่ลงทุนเดินทางไปยังสำนักงานของสตูดิโอ Shift Up ในเกาหลีใต้ เพื่อให้สัมภาษณ์พร้อมๆ กับ Hyung-Tae Kim
Yoko Taro บอกว่าเขาคุ้นเคยกับผลงานของ Hyung-Tae Kim จากเกม Magna Carta: Tears of Blood ในยุค PS2 (ตอนนั้น Kim รับบทเป็นนักวาด) ซึ่งเกมนี้ออกมาก่อน Drakengard เกมแรกที่ Yoko Taro กำกับ ดังนั้นเขามองว่า Kim เป็นรุ่นพี่ในวงการเกม แม้ตัว Taro มีอายุมากกว่าก็ตาม
ไมโครซอฟท์ประกาศลงทุนเชิงกลยุทธ์เป็นเงิน 1,500 ล้านดอลลาร์ ใน G42 บริษัทโฮลดิ้งด้าน AI ของอาบูดาบี เพื่อเสริมความแข็งแกร่งระหว่างสองบริษัท และเป็นโอกาสให้ไมโครซอฟท์ได้นำเทคโนโลยีและองค์ความรู้ AI มาใช้ใน UAE
ผลจากความร่วมมือนี้ Brad Smith ประธานไมโครซอฟท์ จะร่วมเป็นบอร์ดของ G42 ด้วย
ทั้งสองบริษัทมองว่าความร่วมมือนี้ จะช่วยเร่งรองรับการเปลี่ยนผ่านสู่ดิจิทัลในหลายอุตสาหกรรม โดยเฉพาะในภูมิภาคตะวันออกกลาง, เอเชียกลาง และแอฟริกา
ที่มา: G42
Tom Warren นักข่าวแห่ง The Verge อ้างว่าได้เห็นเอกสารสเปกแบบเต็มๆ ของ PS5 Pro หรือโค้ดเนม "Trinity" ซึ่งสอดคล้องกับข้อมูลที่หลุดออกมาก่อนหน้านี้
Meta ประกาศเตรียมหยุดให้บริการ Threads แพลตฟอร์มโซเชียลตัวอักษรในประเทศตุรกีชั่วคราว มีผลตั้งแต่วันที่ 29 เมษายน เป็นต้นไป เพื่อให้เป็นไปตามคำสั่งของหน่วยงานกำกับดูแลการแข่งขันของตุรกีหรือ TCA (Turkish Competition Authority)
TCA ให้เหตุผลว่า Threads ใช้การเชื่อมต่อกับบัญชี Instagram และมีการแลกเปลี่ยนข้อมูลกันระหว่างสองแพลตฟอร์ม เป็นการเพิ่มอำนาจในตลาดการแข่งขันของ Meta
Meta ยังไม่ได้ให้กำหนดช่วงเวลาที่จะปฏิบัติตามแนวทางคำสั่ง เพื่อให้ Threads สามารถให้บริการในตุรกีได้อีกครั้ง แต่แนะนำผู้ใช้งานในตุรกีให้เลือกระหว่าง Deactivate บัญชี Threads เพื่อให้สามารถใช้งานต่อได้หาก Threads กลับมา หรือลบ (Delete) บัญชีทั้งหมดไปเลย
YouTube ประกาศขยายขอบเขตการแบนตัวบล็อกโฆษณาเพิ่มเติม โดยหากผู้ใช้งานดูวิดีโอ YouTube ผ่านแอปภายนอก (3rd Party) ซึ่งมีฟังก์ชันบล็อกโฆษณา อาจพบปัญหาบัฟเฟอร์วิดีโอ หรือพบคำเตือนว่า "The following content is not available on this app" ทำให้ไม่สามารถรับชมวิดีโอได้
ส่วนเหตุผลนั้นก็เหมือนกับที่ YouTube มีแนวทางบล็อกแอป Ad Blocker ทั้งหลายตั้งแต่ปีที่แล้ว เพื่อให้ครีเอเตอร์ได้เงินส่วนแบ่งจากผลงาน และแพลตฟอร์มก็มีเงินจากโฆษณามาใช้พัฒนาระบบ ซึ่งหากผู้ใช้งานไม่ต้องการชมโฆษณา ทางเลือกก็คือสมัคร YouTube Premium นั่นเอง
Adobe สาธิตฟีเจอร์ด้าน AI หลายอย่างให้กับโปรแกรมตัดต่อวิดีโอ Premiere Pro ซึ่ง Adobe บอกว่าเป็นการนำ Generative AI มาช่วยเพิ่มพลังความคิดสร้างสรรค์ ช่วยแก้ไขปัญหาเวิร์กโฟลว์ที่คนตัดต่อพบอยู่
Adobe บอกว่า AI สำหรับโปรแกรมตัดต่อวิดีโอนั้นจะโฟกัสที่สามสิ่งได้แก่ นำ AI มาใช้ในเวิร์กโฟลว์ของโปรแกรมที่นักตัดต่อคุ้นเคย, Generative AI มีเป้าหมายช่วยให้การทำงานเร็วขึ้น เช่นเพิ่ม-ลบวัตถุ หรือขยายเวลาคลิป และต้องมีโมเดล AI ให้เลือกหลากหลาย
ทั้งนี้เครื่องมือ AI สำหรับ Premiere Pro จะมีออกมาให้ใช้งานภายในปีนี้ โดย Adobe พรีวิวฟีเจอร์บางส่วนทั้งจากโมเดล AI ของ Adobe เองอย่าง Firefly Video และโมเดลจากพาร์ตเนอร์เช่น Sora ของ OpenAI, RunwayML และ Pika
Adobe ประกาศราคาแพ็คเกจเสริม Acrobat AI ผู้ช่วยอัจฉริยะสำหรับช่วยจัดการงานเอกสาร หลังจากออกเวอร์ชันทดสอบเบต้ามาก่อนหน้านี้ คิดราคาเริ่มต้นที่ 4.99 ดอลลาร์ต่อเดือน สามารถใช้งานได้ใน Adobe Reader บนเดสก์ท็อปและเว็บ
นอกจากนี้ผู้ช่วย Acrobat AI ยังเพิ่มการใช้งานผ่านมือถือโดยยังมีสถานะเป็นเบต้า
ความสามารถของ Acrobat AI มีทั้งเครื่องมือถาม-ตอบ จากเนื้อหาไฟล์ PDF ตลอดจนไฟล์เอกสารอื่น เช่น Word, PowerPoint, บันทึกการประชุม ฯลฯ, ตัวช่วยสรุปเนื้อหา, ไฮไลท์ส่วนที่สำคัญ และอื่น ๆ ตัว AI ทำงานบน Liquid Mode ที่ Adobe พัฒนาขึ้นจาก LLM ของนักพัฒนาภายนอก
Tesla ประกาศปลดพนักงานมากกว่า 10% ของจำนวนพนักงานทั่วโลก โดย Elon Musk ซีอีโอ Tesla บอกว่า การปลดพนักงานนี้เป็นส่วนหนึ่งของแผนงานเพื่อรองรับการเติบโตในระยะถัดไป ที่ทำให้ต้องประเมินการลดค่าใช้จ่ายและเพิ่มผลิตผลในทุกส่วน จึงมาสู่การตัดสินใจที่ยากลำบากดังกล่าว
จำนวนพนักงานที่ถูกปลดนั้น Tesla ใช้คำว่ามากกว่า 10% ของพนักงานทั้งหมด ซึ่งจำนวน ณ สิ้นปี 2023 มีอยู่ 140,473 คน
ในงาน Google Cloud Next 2024 ผมได้มีโอกาสสัมภาษณ์ Zac Maufe ผู้บริหาร Google Cloud ที่ดูแลอุตสาหกรรมทางการเงินถึงประเด็นการใช้งาน generative AI ในอุตสาหกรรมนี้
Zac ระบุว่าการใช้งาน generative AI ในภาคการเงินส่วนมากยังอยู่ในฐานะเครื่องมือเพิ่มประสิทธิภาพการทำงานของพนักงานมากกว่าจะเป็นเครื่องมือที่ลูกค้าได้ใช้งานโดยตรง โดยแนวทางใช้งานที่เห็นได้ชัดมี 2 อย่าง คือ 1) เป็นเครื่องมือค้นหาข้อมูล สำหรับพนักงานซัพพอร์ตลูกค้าที่จะสามารถค้นหาข้อมูลต่างๆ ได้อย่างรวดเร็ว หรือนักวิเคราะห์ที่อาจจะทำรายงานจากข้อมูลต่างๆ ที่มีอยู่ในองค์กร 2) เป็นเครื่องมือส่งต่องาน เช่นกรณีพนักงานซัพพอร์ตอาจจะพบว่าปัญหาของลูกค้ามีความซับซ้อนสูง และต้องส่งเรื่องให้เจ้าหน้าที่ระดับสูงขึ้น กรณีนี้ generative AI สามารถทำสรุปข้อมูลทั้งหมดที่พนักงานชั้นต้นได้ขอข้อมูลลูกค้ามาแล้ว ทำให้กระบวนการส่งต่อเรื่องเร็วขึ้นมาก
รัฐบาลสหรัฐประกาศข้อตกลงเบื้องต้น ให้เงินอุดหนุนกับซัมซุงอิเล็กทรอนิกส์เป็นเงินสูงสุด 6,400 ล้านดอลลาร์ สนับสนุนการตั้งโรงงานผลิตชิปในรัฐเท็กซัส ซึ่งเป็นการให้เงินสนับสนุนบริษัทผลิตชิปรอบล่าสุด จากกฎหมาย CHIPS Act
ซัมซุงจะใช้เงินสนับสนุนนี้ในการสร้างโรงงานที่เมืองเทย์เลอร์ ตามรายงานข่าวก่อนหน้านี้ ซึ่งโครงการทั้งหมดมีเงินลงทุนราว 45,000 ล้านดอลลาร์ คาดว่าจะสร้างงานเพิ่มได้ราว 17,000 ตำแหน่ง ในส่วนการก่อสร้าง และ 4,500 ตำแหน่งในฝ่ายการผลิต
โรงงานแห่งใหม่ที่ตั้งนี้จะรองรับทั้งการผลิตชิปเทคโนโลยี 4 นาโนเมตร และ 2 นาโนเมตร คาดว่าจะเริ่มสายการผลิตได้ในปี 2026 และ 2027
OpenAI ประกาศตั้งสำนักงานสาขาแห่งแรกในเอเชียที่เมืองโตเกียว ประเทศญี่ปุ่น ตามรายงานที่ออกมาก่อนหน้านี้ โดยพร้อมร่วมมือกับหน่วยงานรัฐ เอกชน และหน่วยงานวิจัยในประเทศ เพื่อพัฒนาเครื่องมือ AI ที่ปลอดภัย และรองรับความต้องการของญี่ปุ่นโดยเฉพาะ
Tadao Nagasaki จะรับตำแหน่งเป็นประธานของ OpenAI Japan ดูแลในด้านต่าง ๆ เช่น การตลาด การดำเนินงาน การสื่อสารองค์กร และส่วนอื่นสำหรับประเทศญี่ปุ่น
ช่วงหลังเราเริ่มเห็นการใช้ฟีเจอร์ AI ช่วยเติมหรือช่วยเขียนข้อความในช่อง UI ต่างๆ กันมากขึ้น เช่น ในหน้าเขียนอีเมลของ Gmail หรือ Microsoft Editor
อย่างไรก็ตาม การใช้งานฟีเจอร์เหล่านี้มักต้องใช้บนแอพเฉพาะกิจที่มีฟีเจอร์เหล่านี้เป็นจุดขาย หากเป็นโปรแกรมเมอร์ทั่วไปที่ไม่ได้สังกัดบริษัทใหญ่ๆ อาจยังไม่มีช่องทางทำฟีเจอร์แบบนี้ได้ง่ายๆ นัก
ไมโครซอฟท์กำลังทดลองขยายฟีเจอร์เหล่านี้ไปยังโปรแกรมเมอร์ทั่วไป โดย .NET เพิ่มฟีเจอร์ชื่อ Smart Component เป็น UI สำเร็จรูป (ที่วงการนี้เขาเรียก component) ลากไปแปะในแอพของตัวเองแล้วใช้งานฟีเจอร์ AI ช่วยเติมข้อความได้ทันที
Bloomberg รายงานข่าวว่า Adobe เริ่มส่งเมลเชิญชวนช่างภาพและศิลปินบางราย ส่งคลิปวิดีโอผู้คนทำกิจวัตรประจำวันต่างๆ เพื่อนำไปเทรน AI โดยให้ค่าตอบแทน 120 ดอลลาร์
เป้าหมายของ Adobe คือต้องการนำคลิปวิดีโอเหล่านี้ไปใช้เป็นข้อมูลเทรนระบบ text-to-video ลักษณะเดียวกับ OpenAI Sora ซึ่งใช้วิธีร่วมมือกับศิลปิน นักแสดง และสตูดิโอฮอลลีวู้ด เช่นกัน แม้มีประเด็นเรื่องลิขสิทธิ์ของวิดีโอที่ใช้เทรนก็ตาม
Spotify กับการฟังเพลงเสียงคุณภาพสูงหรือที่บริษัทเรียกชื่อว่า Spotify HiFi ตั้งแต่ 3 ปีที่แล้ว ซึ่งถึงตอนนี้บริการดังกล่าวก็ยังไม่มีออกมาให้ใช้งาน อย่างไรก็ตามนี่คือสัญญาณล่าสุดว่าแพ็คเกจ Spotify HiFi น่าจะอยู่ในแผนเปิดตัวเร็ว ๆ นี้ (อีกแล้ว)
มีข้อมูลจากโค้ดของ Spotify พบการระบุชื่อแพ็คเกจเสริมชื่อ "Music Pro" ซึ่งระบุว่าได้ฟีเจอร์หลายอย่างรวมทั้ง DJ Remix และส่วนหนึ่งระบุว่าได้ฟังเพลงแบบ Lossless คุณภาพเสียงสูงระดับ 24-bit/44.1kHz แบบไฟล์ FLAC
บริษัทวิจัยตลาด IDC รายงานภาพรวมตลาดสมาร์ทโฟนของไตรมาสที่ 1 ปี 2024 จำนวนส่งมอบ 289.4 ล้านเครื่อง เพิ่มขึ้น 7.8% เมื่อเทียบกับไตรมาสเดียวกันในปีก่อน สะท้อนว่าตลาดสมาร์ทโฟนยังคงอยู่ในทิศทางฟื้นตัว เป็นการเติบโตติดต่อกันไตรมาสที่สาม
นักวิเคราะห์ของ IDC ให้ความเห็นว่า แม้ Top 2 คือซัมซุงและแอปเปิล ต่างจำนวนส่งมอบและส่วนแบ่งตลาดลดลง แต่ก็ยังรักษาตัวเลขในระดับที่สูงโดดเด่นกว่าผู้เล่นอื่น เนื่องจากทั้งสองแบรนด์นี้ครองตลาดสมาร์ทโฟนระดับบนเอาไว้อย่างแข็งแกร่ง พฤติกรรมคนซื้อก็เปลี่ยนมายอมจ่ายแพงขึ้นเพราะมองว่าสมาร์ทโฟนระดับบนคุ้มค่ากว่า
Mark Gurman แห่ง Bloomberg คนเดิม รายงานรายละเอียดเพิ่มเติมเกี่ยวกับ iOS 18 ระบบปฏิบัติการของ iPhone ที่คาดว่าจะเปิดตัวในงานสัมมนา WWDC 2024 เดือนมิถุนายน ซึ่งก่อนหน้านี้มีข้อมูลว่าเป็นอัปเดตใหญ่ที่สุด มีจุดขายเกี่ยวกับ Generative AI
Gurman บอกว่า AI ของ iOS 18 จะประมวลผลและทำงานบนอุปกรณ์ (on device) ทั้งหมด ไม่มีการเชื่อมต่อกับคลาวด์ ซึ่งเป็นจุดขายโมเดล LLM ที่แอปเปิลเตรียมนำเสนอ
Meta ประกาศเพิ่มฟีเจอร์ให้ Instagram DM สามารถสแกนภาพถ่ายที่ส่งให้กันว่าเป็นภาพเปลือยหรือไม่ (nudity protection) เพื่อเตือนทั้งฝั่งของผู้ส่งและผู้รับ และเบลอภาพไม่ให้ถูกมองเห็นตั้งแต่แรก
ฝั่งผู้ส่งภาพจะได้รับคำเตือนว่า การส่งภาพเปลือยของตัวเองให้คนอื่นอาจถูกส่งต่อ (forward) หรือบันทึกหน้าจอภาพนั้นไปใช้งาน ส่วนฝั่งผู้รับภาพจะเห็นภาพเบลอที่มีข้อความ "photo may contain nudity" ต้องกดที่ภาพก่อนถึงจะแสดงภาพเต็มๆ ขึ้นมา เพื่อป้องกันการเห็นภาพที่ไม่พึงประสงค์
Meta บอกว่าฟีเจอร์นี้ใช้เทคนิค on-device machine learning เพื่อวิเคราะห์ภาพภายในเครื่อง โดยบริษัท Meta มองไม่เห็นภาพเหล่านี้ ยกเว้นในกรณีที่มีคนรายงานเข้ามาเท่านั้น
Ola แพลตฟอร์มเรียกรถแท็กซี่แบบออนดีมานด์จากอินเดีย เตรียมถอนการดำเนินธุรกิจนอกประเทศอินเดียทั้งหมด ได้แก่ สหราชอาณาจักร ออสเตรเลีย และนิวซีแลนด์ ภายในสิ้นเดือนนี้ ซึ่งประเทศนี้เหล่านี้ Ola ได้เข้าไปทำตลาดมาตั้งแต่ปี 2018
โฆษกของ Ola ยืนยันแผนถอนธุรกิจนอกประเทศอินเดีย โดยบอกว่าอนาคตของรถยนต์จากนี้รถยนต์ไฟฟ้า ซึ่งส่งผลให้บริการแอปเรียกรถมีโอกาสเติบโตอีกมหาศาลในอินเดีย บริษัทจึงตัดสินใจโฟกัสที่ตลาดอินเดียอย่างเดียว และปิดธุรกิจในต่างประเทศที่ดำเนินงานในปัจจุบันทั้งหมด
กูเกิลประกาศแผนลงทุนวงเงิน 1 พันล้านดอลลาร์ เพื่อปรับปรุงโครงข่ายการเชื่อมต่อเคเบิ้ลใต้น้ำระหว่างสหรัฐอเมริกาและญี่ปุ่น โดยมีทั้งการขยายโครงข่ายในพื้นที่มหาสมุทรแปซิฟิก และเพิ่มเคเบิ้ลใต้น้ำสาย Proa และ Taihei ที่มีปลายทางที่ญี่ปุ่น ซึ่งเป็นความร่วมมือกับพาร์ตเนอร์หลายรายทั้ง KDDI, ARTERIA, Citadel Pacific และ CNMI
เคเบิ้ลใต้น้ำ Proa เป็นการเชื่อมต่อจาก NEC ประเทศญี่ปุ่น ไปยังเครือรัฐหมู่เกาะนอร์เทิร์นมาเรียนา (CNMI) และเกาะกวม เป็นการขยายโครงข่ายของ NEC ที่เชื่อมต่อไต้หวัน-ฟิลิปปินส์-อเมริกา (TPU) ให้ขยายมายัง CNMI ด้วย
ไมโครซอฟท์ออก Visual Studio 17.10 Preview 3 มีของใหม่คือปรับการทำงานของ GitHub Copilot โดยผนวกรวมแพ็กเกจสองตัวคือ Copilot ช่วยเติมโค้ด และ Copilot Chat ช่วยตอบคำถาม เข้าเป็นตัวเดียวกัน ติดตั้งแพ็กเกจตัวเดียวไม่ต้องแยกสองแพ็กเกจแบบก่อนหน้านี้
TCL ผู้ผลิตสมาร์ททีวี ซึ่งมีบริการสตรีมมิ่งเสริมของตนเอง TCLtv+ ด้วย เปิดตัวคอนเทนต์ออริจินัลบนแพลตฟอร์ม ซึ่งสร้างจาก Generative AI ทั้งเรื่อง
ภาพยนตร์สั้นนี้ชื่อเรื่องว่า "Next Stop Paris" โดยนอกจากส่วนงานภาพแล้ว เขียนบท การออกแบบ และเสียงพากย์ ทั้งหมดทำด้วยมนุษย์
TCL ยังไม่ได้เปิดเผยว่าแผนงานจากนี้ จะมีคอนเทนต์ที่สร้างด้วย Generative AI เพิ่มเติมหรือไม่ อย่างไรก็ตาม Next Stop Paris ทำให้เห็นพัฒนาการของการนำ AI มาสร้างเนื้อหาอีกรูปแบบ ซึ่งผลลัพธ์ในตอนนี้ยังสังเกตได้ไม่ยากว่าเป็นงานที่สร้างด้วย AI รับชมเทรลเลอร์ได้ท้ายข่าว
ที่มา: Android Central
Meta ยืนยันการทดสอบแชทบอต Meta AI ภายในแอป WhatsApp, Instagram และ Messenger มีผลกับผู้ใช้งานบางประเทศก่อนได้แก่ อินเดีย และบางส่วนในภูมิภาคแอฟริกา
ก่อนหน้านี้ Meta ได้เปิดตัวแชทบอต Meta AI ที่เป็น LLM ปรับแต่งจากโมเดล Llama 2 ของตนเอง เชื่อมต่อกับข้อมูลเรียลไทม์ของ Bing โดยตามแผนนั้นจะนำมาใส่บริการเกือบทุกตัวของบริษัท การเลือกทดสอบที่อินเดียก่อนมีความสำคัญเพราะมีฐานผู้ใช้งาน Facebook และ WhatsApp รวมกันกว่า 500 ล้านคน
ทั้งนี้ Meta ยังยืนยันแผนการออกโมเดล AI LLM รุ่นใหม่ Llama 3 ภายในเดือนหน้าด้วย
ประเด็นเรื่อง MacBook Pro/Air M3 ให้แรมเริ่มต้นแค่ 8GB ยังเป็นเรื่องที่แอปเปิลถูกวิจารณ์ อยู่เรื่อยๆ ล่าสุดผู้บริหารแอปเปิลสองคนคือ Kate Bergeron หัวหน้าฝ่ายวิศวกรรมฮาร์ดแวร์ และ Evan Buyze ผู้บริหารฝ่ายการตลาดแมค ให้สัมภาษณ์กับสื่อจีน ITHome ก็ยังโดนถามเรื่องนี้อีกว่าแรม 8GB บน MacBook Air นั้นพอใช้ไหม
คำตอบของ Buyze คือแรม 8GB เพียงพอสำหรับงานทั่วไป อย่างเช่นการท่องเน็ต ชมภาพยนตร์สตรีมมิ่ง ส่งข้อความ แต่งภาพหรือวิดีโอง่ายๆ แล้ว
Baldur's Gate 3 คว้ารางวัล BAFTA Games Awards จากฝั่งอังกฤษอีก 5 รางวัล ได้แก่ เกมยอดเยี่ยม, เล่าเรื่องยอดเยี่ยม, เพลงประกอบยอดเยี่ยม, นักแสดงสมทบยอดเยี่ยม (Andrew Wincott ในบท Raphael) และเกมยอดนิยมจากผู้เล่น (Player's Choice)
BAFTA หรือ British Academy of Film and Television Arts เป็นสถาบันด้านภาพยนตร์และทีวีของอังกฤษ เทียบได้กับรางวัลออสการ์ของสหรัฐอเมริกา แต่ BAFTA ได้แตกแขนงมามอบรางวัลให้วิดีโอเกมมาตั้งแต่ปี 2004 (ครบรอบ 20 ปีพอดี) ถือเป็นรางวัลใหญ่ของวงการเกมฝั่งอังกฤษ
xAI บริษัทด้านปัญญาประดิษฐ์ของ Elon Musk พรีวิวความสามารถของ Grok-1.5 Vision โมเดล AI ภาษาขนาดใหญ่บนข้อมูลสื่อผสม (Multimodal) หลังจากเปิดตัว Grok-1.5 ไปเมื่อเดือนที่แล้ว
Grok-1.5V มีความสามารถรับอินพุทและดำเนินการข้อมูลภาพในรูปแบบต่าง ๆ เช่น เอกสาร, แผนผัง, ตาราง, ภาพหน้าจอ ไปจนถึงภาพถ่าย ผลทดสอบเทียบกับโมเดลข้อมูลสื่อผสมตัวอื่นพบว่าทำได้ใกล้เคียง โดยโดดเด่นกว่าในบางผลทดสอบเช่น Mathvista (คณิตศาสตร์), TextVQA (อ่านข้อความ)