ทีมนักวิจัยของแอปเปิลเผยแพร่งานวิจัยใหม่ Ferret-UI ซึ่งเป็น Generative AI หรือ AI สร้างเนื้อหา ที่ต้องการแก้ไขปัญหาโมเดลภาษาขนาดใหญ่ข้อมูลผสมผสาน (MLLM - Multimodal Large Language Model) ที่ยังมีข้อจำกัดสำหรับอินพุทรูปภาพ ที่มีรายละเอียดเยอะมาก แต่อาจมีจุดสำคัญไม่กี่อย่าง เช่น ภาพจับหน้าจอโทรศัพท์ (Screen Capture)
สิ่งที่ท้าทายของอินพุทภาพหน้าจอโทรศัพท์คือ อัตราส่วนภาพหน้าจอโทรศัพท์ ที่แตกต่างจากรูปที่ AI นิยมใช้เทรนกัน, ในภาพหน้าจอมีไอคอนหรือปุ่ม ที่มีขนาดเล็ก ความละเอียดต่ำ AI อาจแยกแยะไม่ได้ และหลายกรณีปุ่มเหล่านั้นคือประเด็นสำคัญของอินพุทอีกด้วย
อินเทลเปิดตัวชิปเร่งการประมวลผลปัญญาประดิษฐ์รุ่นใหม่ Intel Gaudi 3 ที่เคยโชว์แผนเมื่อปีที่แล้ว ใช้กระบวนการผลิตระดับ 5 นาโนเมตร
ชิป Gaudi มาจากการซื้อบริษัท Habana Labs ในปี 2019 และอัพเกรดเป็น Gaudi 2 เมื่อปี 2022 โดยเป็นชิปที่อินเทลวางตัวมาแข่งกับชิประดับสูงของ NVIDIA โดยตรง
สถาปัตยกรรมของ Gaudi 3 ประกอบด้วยหน่วยประมวลผลย่อย 3 ตัวในชิปเดียว ได้แก่
ผู้อ่าน Blognone น่าจะยังจำชื่อของ Beeper แอปแชทที่รองรับการสนทนาหลายแพลตฟอร์มจบในที่เดียว ซึ่งเป็นข่าวต่อเนื่องช่วงหลายเดือนที่ผ่านมา ในความพยายามสร้าง Beeper Mini ที่ทำให้แอปรองรับ iMessage ของแอปเปิล ซึ่งจบที่ไม่สำเร็จ
ล่าสุด Automattic บริษัทแม่ของ WordPress.com และ Tumblr ประกาศเข้าซื้อกิจการ Beeper แล้ว โดยไม่มีการเปิดเผยมูลค่าอย่างเป็นทางการ แต่ TechCrunch อ้างแหล่งข่าวระบุว่าอยู่ที่ประมาณ 125 ล้านดอลลาร์ ทำให้เป็นดีลซื้อกิจการแอปส่งข้อความตัวที่สองของบริษัทต่อจาก Texts เมื่อเดือนตุลาคมปีที่แล้ว
นอกเหนือจาก Google Vids แอปสร้างวิดีโอจากเอกสารใน Google Docs และ Google Sheets กูเกิลยังประกาศฟีเจอร์ใหม่พลัง Gemini หลายอย่างสำหรับคนใช้งาน Google Workspace มีรายละเอียดดังนี้
ในงาน Google Cloud Next 2024 กูเกิลเชิญผู้ให้บริการองค์กร จากองค์กรขนาดใหญ่ เช่น กลุ่มโรงแรม IHG, Verizon, Bayer โดยองค์กรเหล่านี้เตรียมใช้งาน generative AI ในแอปพลิเคชั่นที่ติดต่อกับลูกค้าแล้ว แม้จะมองเห็นโอกาสมากแต่ก็ยังเป็นการใช้งานอย่างระมัดระวังอยู่
Kalyani Sekar Chief Data Officer จาก Verizon ระบุว่าการสร้างแอปพลิเคชั่น generative AI นั้นควรเริ่มปล่อยให้ใช้งานจากวงเล็กภายในองค์กรเองก่อน และค่อยๆ ขยายไปยังกลุ่มใหญ่ขึ้นจนถึงผู้ใช้ภายนอกองค์กร เพื่อจะได้เห็นความสามารถและข้อจำกัดของระบบ และจุดสำคัญที่สุดของการใช้งาน generative AI นั้นอาจจะไม่ใช่ปัญหาว่ามันตอบอะไรได้บ้าง แต่ต้องพยายามไม่ให้ AI ตอบคำถามที่มันจะตอบผิด แล้วส่งให้คนทำงานเป็นคนตอบแทน
Google Workspace เพิ่มแอปสร้างวิดีโอในชื่อ Google Vids ที่สามารถขึ้นโครงวิดีโอจากเอกสารเดิม เช่น Google Docs หรือ Google Sheets ทำเป็นบทวิดีโอ แล้วสามารถใช้เสียงพูดจากปัญญาประดิษฐ์เพื่อพากษ์วิดีโอ หรือจะใช้เสียงผู้ใช้เองก็ได้
ตอนนี้ Google Vids ยังเป็นโปรแกรมทดสอบ จะเริ่มเปิดให้ผู้ใช้เปิดใช้งานจาก Workspace Labs เดือนมิถุนายนนี้ โดยบริการนี้เป็นส่วนหนึ่งของฟีเจอร์ Gemini for Workspace ต้องเป็นลูกค้าแพ็กเกจนี้ (ส่วนเสริมขายแยก 20-30 ดอลลาร์ต่อเดือน)
ที่มา - Google Workspace Blog
กูเกิลอัพเดตโมเดลปัญญาประดิษฐ์สร้างภาพ Imagen 2.0 โดยเพิ่มฟีเจอร์สำคัญคือการสร้างภาพเคลื่อนไหว และการแก้ไขภาพที่มีอยู่เดิม
การสร้างภาพเคลื่อนไหว เรียกว่า text-to-live image ยังจำกัดที่ความละเอียด 360x640 ยาว 4 วินาที ที่ 24 เฟรมต่อวินาที
สำหรับการแก้ไขภาพ รองรับทั้ง inpainting แก้ไขภายในภาพ และ outpainting เติมภาพเพื่อขยายขนาด รองรับการเพิ่มหรือลดวัตถุในภาพ
ภาพทั้งหมดที่สร้างโดย Imagen จะถูกฝังข้อมูล SynthID เพื่อระบุว่าภาพถูกสร้างโดยปัญญาประดิษฐ์ของกูเกิล
กูเกิลเปิด Gemini 1.5 Pro ให้คนทั่วไปใช้งานแล้ว หลังจากเปิดตัวแบบจำกัดเมื่อเดือนกุมภาพันธ์ที่ผ่านมา พร้อมกับเพิ่มฟีเจอร์ค้นหาข้อมูลอ้างอิง (grounding) ทั้งการค้นด้วย Google Search และการค้นข้อมูลภายในองค์กรเอง
สำหรับการค้นข้อมูลในองค์กร เดิม Vertex AI มีบริการ Enterprise Search อยู่แล้ว ตอนนี้เพิ่มความสามารถเชื่อมต่อกับฐานข้อมูลภายนอก เช่น AlloyDB หรือ BigQuery เข้ามาเพิ่ม และยังเชื่อมต่อแอปที่องค์กรใช้งานอยู่ เช่น Workday, Salesforce, ServiceNow, Hadoop, Confluence, และ JIRA
กูเกิลปล่อยโมเดลปัญญาประดิษฐ์ LLM สำหรับเขียนโค้ดในชื่อ CodeGemma เน้นใช้งานเป็นตัวช่วยเขียนโค้ดโดยเฉพาะ โดยมีโมเดล 3 รุ่น ได้แก่
มีรายงานจาก Nikkei ระบุว่า ไมโครซอฟท์มีแผนจะลงทุนในประเทศญี่ปุ่นเป็นเงินถึง 2,900 ล้านดอลลาร์ ภายในระยะเวลาสองปีข้างหน้า เพื่อเร่งขยายธุรกิจที่เกี่ยวข้องกับ AI ในญี่ปุ่น
ทั้งนี้ไมโครซอฟท์จะประกาศแผนการลงทุนดังกล่าวอย่างเป็นทางการเร็ว ๆ นี้ เมื่อนายกรัฐมนตรีของญี่ปุ่น Fumio Kishida เดินทางไปเยือนสหรัฐ
แผนการลงทุนของไมโครซอฟท์ จะมีทั้งการติดตั้งชิปประมวลผล AI ขั้นสูง ในศูนย์ข้อมูลซึ่งมีอยู่สองแห่งที่โตเกียวและโอซากา รวมทั้งลงทุนเกี่ยวกับการฝึกอบรมรีสกิลแรงงาน ตั้งเป้าหมายที่ 3 ล้านคน ภายในระยะเวลา 3 ปี และสร้างศูนย์วิจัยพัฒนาด้านหุ่นยนต์กับ AI
มีรายงานว่าซัมซุงอิเล็กทรอนิกส์ เตรียมประกาศว่าบริษัทได้รับอนุมัติเงินสนับสนุนราว 6-7 พันล้านดอลลาร์ จากรัฐบาลสหรัฐในโครงการสนับสนุนการตั้งโรงงานผลิตชิป CHIPS Act
เงินสนับสนุนนี้ ซัมซุงจะนำมาใช้ในโครงการก่อสร้างโรงงานเซมิคอนดักเตอร์ 4 แห่ง ในเมืองเทย์เลอร์ รัฐเท็กซัส ที่บริษัทมีแผนลงทุนประมาณ 1.7 หมื่นล้านดอลลาร์ เป็นทั้งโรงงานผลิตชิป โรงงานแพ็คเกจจิ้งชิป และศูนย์วิจัยพัฒนา
ทั้งนี้ซัมซุงปฏิเสธที่จะให้ความเห็นต่อรายงานดังกล่าว
กูเกิลเปิดเผยว่าบริษัทได้พัฒนาชิปประมวลผลใหม่ เรียกชื่อว่า Axion เพื่อรองรับงานด้าน AI เป็นหลัก ซึ่งกูเกิลมีแผนการพัฒนาซีพียูส่วนนี้มาหลายปีแล้ว แต่มาเร่งมากขึ้นหลัง ChatGPT เปิดตัวช่วงปลายปี 2022
การที่กูเกิลลงทุนพัฒนาชิปสำหรับใช้งาน AI บนคลาวด์ของตนเองไม่ใช่เรื่องแปลก เพราะทั้งอเมซอนและไมโครซอฟท์ ก็พัฒนาชิปสำหรับงานด้าน AI ของตนเองเช่นกัน กูเกิลเองก็มีหน่วยประมวลผลที่พัฒนาเองเรียกว่า TPU ซึ่งมีใช้งานมาตั้งแต่ปี 2016 แต่กรณีของ Axion นั้นทำงานเป็นหน่วยประมวลผลกลางหรือเป็นซีพียู
องค์กรจำนวนมากเตรียมรับมือยุค AI ด้วยการสร้างข้อมูลขนาดใหญ่ ขยายความสามารถของระบบ Data Lake ในองค์กร แต่หากสตอเรจขององค์กรไม่พร้อมก็จะนำไปสู่ข้อจำกัดทั้งด้านประสิทธิภาพ และพื้นที่สตอเรจที่รองรับข้อมูลปริมาณมหาศาลไม่ไหว
IBM Storage Scale by G-Able โซลูชันสตอเรจที่รองรับทุกแอปพลิเคชันในองค์กร พร้อมกับความสามารถในการจัดการอย่างเป็นระบบ ทั้งนโยบายการจัดเก็บข้อมูลและความปลอดภัย เปิดทางให้องค์กรสร้างแพลตฟอร์มสตอเรจได้อย่างสมบูรณ์
กูเกิลประกาศนำโมเดล Gemini 1.0 Pro มาใส่ในเครื่องมือสำหรับนักพัฒนา Android Studio พร้อมรีแบรนด์ Studio Bot ที่เป็น AI ช่วยการเขียนโค้ด ในชื่อใหม่ Gemini in Android Studio เพื่อให้ทิศทางผลิตภัณฑ์ AI ของกูเกิลเป็นไปในทิศทางเดียวกันทั้งหมดภายใต้แบรนด์ Gemini
Gemini in Android Studio เป็นผู้ช่วยการเขียนโค้ดซึ่งสามารถเรียกใช้งานได้โดยตรงใน IDE กูเกิลบอกว่าทำให้การพัฒนาโค้ดคุณภาพสูง ทำได้รวดเร็วขึ้น ช่วยแก้ไขปัญหาโค้ดที่ซับซ้อน สามารถถาม-ตอบ ตลอดจนเพิ่มคอมเมนต์และค้นหาข้อมูลที่ต้องการได้ ตอนนี้มีให้ใช้งานแล้วใน Android Studio Jellyfish
Uber Eats แอปสั่งอาหารเดลิเวอรี ทดสอบฟีเจอร์ใหม่ให้ร้านค้าสามารถอัปโหลดคลิปวิดีโอแนวตั้ง เพื่อแสดงผลในรูปแบบสตอรีได้ ผู้ใช้งานก็สามารถปัดเพื่อดูวิดีโอถัดไปได้เรื่อย ๆ
Awaneesh Verma ผู้อำนวยการฝ่ายผลิตภัณฑ์ของ Uber Eats บอกว่าวิดีโอแนวตั้ง ช่วยให้ร้านอาหารสามารถนำเสนอข้อมูล ที่ให้ลูกค้าเห็นรายละเอียดของอาหาร หน้าตา ส่วนประกอบ ได้ดีมากขึ้น ฝั่งร้านอาหารเองปัจจุบันก็มีการทำการตลาดด้วยวิดีโอแนวตั้งผ่านแพลตฟอร์มอื่นอยู่แล้ว การนำวิดีโอเหล่านี้มาใส่ใน Uber Eats ก็เพิ่มโอกาสให้ลูกค้าสนใจมากขึ้น
ฟีเจอร์นี้ Uber Eats จะทดสอบเฉพาะในบางเมืองก่อน แล้วจะขยายไปยังผู้ใช้งานทั่วโลกที่ Uber Eats มีให้บริการ
Threads เพิ่มหน้ารายละเอียดของ API สำหรับนักพัฒนาในเว็บไซต์แล้ว หลังจากทดสอบแบบจำกัดกลุ่มเมื่อเดือนที่แล้ว โดยมีทั้งเอกสาร (Documentation) การใช้งาน API และหน้าสมัครใช้งาน API ซึ่งกำหนดเปิดให้ใช้งานทั่วไปในเดือนมิถุนายน
รายละเอียดสำคัญของ Threads API นั้น นักพัฒนาสามารถดึงข้อมูลได้ทั้ง จำนวนวิว, ไลค์, รีพลาย, รีโพสต์, โควท ไปจนถึงวิธีการโพสต์ข้อความ-รูปภาพผ่าน API และอื่น ๆ ที่เกี่ยวข้อง
ข้อจำกัดในการใช้ API ตอนนี้อยู่ที่โพสต์ได้ 250 ครั้ง ภายใน 24 ชั่วโมง ตอบโพสต์ (รีพลาย) ได้ 1,000 ครั้ง เพื่อป้องกันการใช้ API ทำสแปม
Tom Warren นักข่าวสายไมโครซอฟท์ของ The Verge อ้างแหล่งข่าวและเอกสารภายในของไมโครซอฟท์ ระบุว่าไมโครซอฟท์มั่นใจอย่างมากที่พีซี Snapdragon X Elite ที่จะออกสู่ตลาดในเร็วๆ นี้ สามารถเอาชนะชิป Apple M3 ของแอปเปิลได้
ไมโครซอฟท์พยายามผลักดันพีซีพลัง Arm มาหลายปีแต่ไม่ประสบความสำเร็จ การมาถึงของ Snapdragon X Elite ที่คุยว่ามีประสิทธิภาพเพิ่มขึ้นอย่างก้าวกระโดด น่าจะช่วยแก้ปัญหานี้ได้
จากเอกสารของไมโครซอฟท์ระบุว่า พีซีรุ่นใหม่จะเอาชนะ Apple M3 ได้ทั้งประสิทธิภาพซีพียู, การเร่งความเร็วงาน AI หรือแม้แต่การรันแอพ x86 เดิมผ่านอีมูเลเตอร์ ซึ่งไมโครซอฟท์บอกว่าเร็วกว่า Rosetta 2 ของแอปเปิล
X หรือ Twitter ประกาศรองรับการล็อกอินบัญชีด้วย Passkey สำหรับผู้ใช้ iOS ทั่วโลกแล้ว หลังจากเปิดให้ใช้งานเฉพาะในสหรัฐอเมริกาก่อนหน้านี้ ส่วนแพลตฟอร์มอื่นยังไม่มีประกาศว่าจะใช้งานได้เมื่อใด
Passkey เป็นการยืนยันตัวตนผู้ใช้งาน โดยลดความเสี่ยงจากการกรอกรหัสผ่าน มาเป็นการยืนยันผ่านอุปกรณ์เข้ารหัส ซึ่งมีความปลอดภัยมากกว่าวิธียืนยันตัวตนสองขั้นตอนแบบอื่น
มีรายงานว่า Applied Materials บริษัทผู้ผลิตเครื่องจักรสำหรับใช้ในการผลิตชิปรายใหญ่ของอเมริกา อาจเลื่อนหรือยกเลิกแผนก่อสร้างศูนย์วิจัยและพัฒนาแห่งใหม่ในซิลิคอนแวลลีย์ เนื่องจากอาจไม่ได้รับเงินสนับสนุนจากรัฐบาลสหรัฐ ตามกฎหมายส่งเสริมการผลิตชิปในประเทศ CHIPS Act
ก่อนหน้านี้ Applied Materials ประกาศแผนสร้างศูนย์วิจัยและพัฒนาแห่งใหม่ มูลค่าโครงการประมาณ 4 พันล้านดอลลาร์ คาดว่าจะสร้างงานประมาณ 2,000 ตำแหน่ง และอีกมากกว่าหมื่นตำแหน่งในส่วนที่เกี่ยวข้อง ซึ่งทาง Applied Materials ก็ได้ยื่นคำขอรับเงินสนับสนุนด้วย โดยบอกว่าเป็นสิ่งจำเป็น
ปัจจุบัน TikTok สามารถอัปโหลดโพสต์ที่มีเฉพาะรูปภาพได้ อย่างไรก็ตามมีรายงานมาระยะหนึ่งแล้วว่า TikTok อาจออกแอปแยกที่โฟกัสเฉพาะคอนเทนต์ภาพนิ่งอย่างเดียว ซึ่งเป็นการชนกับฟังก์ชันกับพื้นฐานของ Instagram
ล่าสุดมีผู้ใช้งานพบข้อความเตือนเมื่ออัปโหลดรูปภาพ บอกว่า TikTok จะมีแอปใหม่สำหรับการโพสต์รูปภาพโดยเฉพาะชื่อว่า TikTok Notes ออกมาเร็ว ๆ นี้ เมื่อผู้ใช้งานโพสต์ภาพใน TikTok แอปหลัก คอนเทนต์นี้ก็จะไปโพสต์ที่ TikTok Notes ด้วย แต่สามารถตั้งปิดการแชร์ได้
ตัวแทนของ TikTok ยืนยันว่าบริษัทอยู่ในขั้นตอนการพัฒนาแอปนี้ เพื่อเพิ่มประสบการณ์ใช้งานและความคิดสร้างสรรค์บน TikTok ในรูปแบบภาพนิ่งกับข้อความ แต่ยังไม่มีกำหนดว่าจะออกมาเมื่อใด
กูเกิลประกาศเปิดเครือข่าย Find My Device ตามหาอุปกรณ์หายแบบออฟไลน์ ตามที่แจ้งไว้ก่อนหน้านี้ โดยเริ่มจากในสหรัฐอเมริกาและแคนาดาก่อน
Find My Device สามารถตามหาสมาร์ทโฟนและแท็บเล็ตแอนดรอยด์ได้แม้ไม่ต่อเน็ต เพราะใช้เครือข่าย Bluetooth แบบ mesh ของอุปกรณ์ที่กระจายตัวทั่วโลก (ลักษณะเดียวกับ Find My ของแอปเปิลที่มีตั้งแต่ปี 2019) ในกรณีของ Pixel 8 และ Pixel 8 Pro ยังมีฮาร์ดแวร์พิเศษที่ตามรอยได้แม้ปิดเครื่องหรือแบตหมดด้วย
บริษัทวิจัยตลาด IDC รายงานภาพรวมตลาดพีซีของไตรมาสที่ 1 ปี 2024 เติบโต 1.5% จากช่วงเดียวกันในปีก่อน 2023 มีจำนวนส่งมอบ 59.8 ล้านเครื่อง ทำให้ตลาดพีซีกลับมาเติบโตอีกครั้งในไตรมาสที่ 1 หลังจากลดลงมาสองปี
IDC บอกว่าสาเหตุหลักที่ตลาดพีซีไตรมาสที่ผ่านมาเติบโต ก็เพราะฐานจำนวนส่งมอบของปี 2023 ที่ต่ำมาก (ลดลงจากปี 2022 29%) จำนวนส่งมอบที่เพิ่มขึ้นนี้ทำให้ตลาดพีซีกลับมาที่ระดับก่อนเกิดโควิดอีกครั้ง
ศาลสูงสุดของมอนเตเนโกรยกเลิกคำสั่งของศาลชั้นต้น ที่ให้ส่งตัว Do Kwon ผู้ก่อตั้ง Terraform Labs และสร้างเหรียญ Terra/Luna ในฐานะผู้ร้ายข้ามแดน ซึ่งมีสองประเทศคือสหรัฐอเมริกา และเกาหลีใต้ที่ยื่นขอตัว โดยการเลือกประเทศส่งกลับนั้นอยู่ที่รัฐมนตรีกระทรวงยุติธรรมมอนเตเนโกร
คำสั่งศาลสูงสุดระบุว่า อำนาจการตัดสินใจว่าจะส่งตัว Do Kwon ที่ถูกร้องขอจากสองประเทศพร้อมกันนั้น ต้องเป็นการตัดสินใจของศาล ขั้นตอนการตัดสินที่เกิดขึ้นจึงไม่เป็นไปตามขั้นตอน ตามที่ทนายของ Do Kwon ร้องเรียน โดยให้ศาลอุทธรณ์พิจารณาคดีนี้ใหม่อีกครั้งว่าจะส่ง Do Kwon ไปประเทศใด
ไมโครซอฟท์ประกาศตั้งสำนักงานสาขาของ Microsoft AI หน่วยงานใหม่ที่เพิ่งก่อตั้งเพื่อดูแลผลิตภัณฑ์ทั้งหมดของ AI โดยสำนักงานสาขานี้ตั้งอยู่ที่ลอนดอน สหราชอาณาจักร เรียกว่า Microsoft AI London เพื่อพัฒนา AI และโมเดลสำหรับตลาดในภูมิภาค ตลอดจนรองรับตลาดวิศวกร AI ในประเทศ
การประกาศตั้งสาขา Microsoft AI London ไม่ใช้เรื่องเกินคาดหมายนัก เพราะ Mustafa Suleyman ซีอีโอ Microsoft AI ที่เป็นผู้ร่วมก่อตั้ง DeepMind เกิดและเติบโตที่อังกฤษ จึงเข้าใจตลาดแรงงานด้าน AI ในประเทศเป็นอย่างดี
Groq บริษัทพัฒนาชิปสำหรับประมวลผลปัญญาประดิษฐ์แบบ LLM โดยเฉพาะ ประกาศเลิกขายชิปให้กับลูกค้าทั่วไปแล้ว หลังยอมรับว่าขายยากเพราะลูกค้าต้องลงทุนสูง และตอนนี้ก็มีลูกค้าบนบริการคลาวด์จำนวนมาก
หากลูกค้าของ Groq ต้องการชิปจำนวนมากหลังจากนี้จะเป็นการเซ็นสัญญาร่วมกับศูนย์ข้อมูลเพื่อเข้าไปติดตั้งเซิร์ฟเวอร์ให้ลูกค้าใช้งานโดยเฉพาะ ตอนนี้มีลูกค้าแบบนี้คือ Aramco บริษัทน้ำมันจากซาอุดิอาระเบีย แต่มีข้อยกเว้นอยู่บ้างคือโครงการภาครัฐที่ยังซื้อชิปตรงได้