ทีมวิศวกรของฝ่ายวิจัย Machine Learning ของแอปเปิล เผยแพร่รายละเอียดตัวเร่งการทำ LLM Inference โดยร่วมมือกับ NVIDIA เพื่อทดสอบประสิทธิภาพบนจีพียูของ NVIDIA
เครื่องมือที่แอปเปิลพัฒนาและโอเพนซอร์สนี้ชื่อว่า Recurrent Drafter หรือย่อว่า ReDrafter เป็นโมเดลที่รวมสองอัลกอริทึมคือ Beam Search กับ Dynamic Tree Attention เพื่อเร่งความเร็วในการสร้างโทเค็นผลลัพธ์ของ LLM สูงสุดที่ระดับ 3.5 โทเค็นต่อหนึ่งขั้นตอนของโมเดลโอเพนซอร์ส
ผลการทดสอบความเร็วในการสร้างโทเค็นผลลัพธ์ด้วย TensorRT-LLM ของ NVIDIA พบว่า ReDrafter ทำงานได้เร็วกว่าวิธีดั้งเดิม 2.7 เท่า ทำให้วิธีการนี้อาจนำมาช่วยให้การสร้างผลลัพธ์ของ LLM ให้เร็วขึ้นในมุมผู้ใช้งาน และลดการใช้ทรัพยากรจีพียูลงได้ด้วย
ในงาน PS5 Pro Technical Seminar ที่เปิดเผยรายละเอียดเชิงเทคนิคของ PS5 Pro Mark Cerny ที่เป็น Lead Architect ของ PS5, PS5 Pro ประกาศข่าวความร่วมมือระหว่าง SIE กับ AMD ในโปรเจ็ค Amethyst ซึ่งที่มาของชื่อก็มีแค่เอาสีฟ้าของ PlayStation และสีแดงของ AMD มารวมกัน
เป้าหมายของโปรเจ็คนี้มี 2 ส่วน ส่วนแรกคือ พัฒนาสถาปัตยกรรมฮาร์ดแวร์สำหรับ Machine Learning และ AI ในอนาคตร่วมกัน โดยเฉพาะสถาปัตยกรรมฮาร์ดแวร์ที่จะนำมาใช้รันโมเดล convolutional neural networks (CNNs) ขนาดเล็กสำหรับกราฟิคเกมโดยเฉพาะ ส่วนที่สองคือ พัฒนาโมเดล CNNs คุณภาพสูงสำหรับเกมออกมาเพิ่มเติม
ข้อมูลที่ Mark Cerny เปิดเผยออกมายังไม่มีความชัดเจนอะไรมากไปกว่านี้
แผนกวิจัยของ DeepMind ขึ้นชื่อเรื่องการนำโมเดล machine learning ไปใช้กับงานวิจัยแขนงต่างๆ ตัวอย่างที่ชัดเจนคือ AlphaFold ใช้ช่วยงานวิจัยโปรตีนจนได้รับรางวัลโนเบลสาขาเคมี
ล่าสุด DeepMind เผยแพร่งานวิจัย AlphaQubit ในวารสาร Nature เป็นการนำเทคนิค machine learning ของ DeepMind ไปช่วยงานวิจัยด้านควอนตัมคอมพิวเตอร์ของทีม Google Quantum AI
มีประเด็นเล็ก ๆ จากที่ Geoffrey Hinton หนึ่งในสองนักวิทยาศาสตร์ที่ได้รับรางวัลโนเบลสาขาฟิสิกส์ประจำปี 2024 จากงานวิจัยด้าน Machine Learning ซึ่งที่ผ่านมาเขาให้ความสำคัญเรื่องอันตรายจาก AI มาก จนเลือกลาออกจากกูเกิลเพื่อให้มีอิสระในการวิจารณ์
Hinton กล่าวในโอกาสที่รับรางวัลโนเบล ในงานแถลงข่าวของ University of Toronto โดยตอนหนึ่งเขาบอกว่า "ผมเป็นคนที่โชคดี เพราะมีลูกศิษย์ที่ฉลาดจำนวนมาก ฉลาดมากกว่าผมด้วย พวกเขาออกไปทำในสิ่งที่ถูกต้อง ทำในสิ่งที่ดี ที่ผมภาคภูมิใจเป็นพิเศษก็คือลูกศิษย์คนหนึ่งของผมได้ไล่ Sam Altman ออกด้วย"
Geoffrey Hinton และ John Hopfield เป็นนักวิทยาศาสตร์ที่ได้รางวัลโนเบลสาขาฟิสิกส์ประจำปี 2024 จากผลงานวิจัยด้าน machine learning
John Hopfield ปัจจุบันอายุ 91 ปีแล้ว เขาจบปริญญาเอกสาขาฟิสิกส์จาก Cornell University และเป็นผู้บุกเบิกงานวิจัยด้าน neural network และคิดค้น Hopfield network เครือข่ายนิวรอนแบบชั้นเดียว ที่นิวรอนแต่ละตัวเชื่อมกับนิวรอนตัวอื่น
กูเกิลประกาศเปลี่ยนชื่อ TensorFlow Lite (TF Lite) รันไทม์สำหรับรันโมเดล AI บนอุปกรณ์พกพา มาเป็นชื่อใหม่ LiteRT (RT = Runtime)
เหตุผลที่เปลี่ยนเป็นเพราะ TensorFlow Lite พัฒนาตัวเองไปไกลมากกว่า TensorFlow โดยรองรับโมเดลที่พัฒนาด้วยเฟรมเวิร์คยี่ห้ออื่นๆ เช่น PyTorch, JAX, Keras ด้วย รองรับโมเดลหลายรูปแบบทั้ง ML, LLM, diffusion ทำให้การมีคำว่า TensorFlow แปะอยู่ในชื่อจึงชวนให้สับสน ว่าตกลงแล้วใช้กับโมเดลค่ายไหนได้บ้าง
ชื่อใหม่ LiteRT สืบทอดคำว่า Lite ของเดิมต่อ และต้องการแสดงให้เห็นว่าเป็นรันไทม์ขนาดเบา (lite) เอาไว้รันงาน on-device AI บนอุปกรณ์พกพาได้หลากหลาย
ไมโครซอฟท์มี DirectML เป็นไลบรารีมาตรฐานสำหรับงานประมวลผล AI บนวินโดวส์ ใช้งานกับฮาร์ดแวร์ได้หลากหลาย ทั้งซีพียู จีพียู และ NPU โดยก่อนหน้านี้รองรับ NPU ของ Intel Core Ultra
ล่าสุดไมโครซอฟท์ประกาศว่า DirectML รองรับ Hexagon NPU ของชิป Snapdragon X Elite แล้ว แปลว่านักพัฒนาที่ซื้อ Copilot+ PC พลัง Arm สามารถเรียกใช้งาน NPU ผ่าน DirectML ได้เอง โดยจำเป็นต้องใช้ Windows 11 24H2 ที่ยังมีสถานะเป็นรุ่นทดสอบอยู่
ปัญญาประดิษฐ์ตอนนี้สามารถทำความเข้าใจภาพ-เสียงได้เป็นอย่างดี แต่ประสาทสัมผัสหนึ่งที่คอมพิวเตอร์และ AI ยังเข้าไม่ถึงอย่างน้อยก็ตอนนี้คือการดมกลิ่น
Osmo เป็นสตาร์ทอัปที่ก่อตั้งโดย Alex Wiltschko และเขาก็เป็นซีอีโออยู่ มีเป้าหมายคือพัฒนาเทคโนโลยี AI ที่สร้างกลิ่นตามเงื่อนไขได้แบบที่เราใช้ AI สร้างภาพและข้อความเสียง
Wiltschko เป็นผู้เชี่ยวชาญด้านระบบประสาทวิทยาการดมกลิ่น เขาจบปริญญาเอกด้านนี้จาก Harvard University และทำงานเป็นนักวิจัยที่ฝ่าย Google Research โดยตอนนั้นงานของเขาคือการพัฒนา Machine Learning ที่สามารถคาดเดากลิ่นที่เกิดขึ้นจากโครงสร้างโมเลกุลที่ระบุ ซึ่งต่อมาเขาก็ลาออกมาก่อตั้ง Osmo ในปี 2022
Slack มีฟีเจอร์ด้าน AI หลายอย่างและเปิดใช้งานมาแล้วตั้งแต่ต้นปี ซึ่งตอนนั้นบอกว่าไม่ได้นำข้อมูลแชทผู้ใช้งานไปเทรนข้อมูล แต่ก็ไม่ได้บอกว่าแล้วเอาข้อมูลที่ไหนมาเทรน
ล่าสุด Corey Quinn ผู้บริหาร DuckBill Group แพลตฟอร์มจัดการต้นทุนการใช้คลาวด์ เปิดเผยการค้นพบใน Slack เป็นข้อความที่ระบุว่า หากองค์กรต้องการยกเว้นการใช้ข้อมูลของลูกค้ามาเทรนโมเดลก็สามารถยกเลิก (opt-out) ได้ โดยให้ตัวแทนหลักขององค์กรที่ติดต่อกับ Slack อีเมลแจ้งขอ opt-out แล้ว Slack จะทำการยกเว้นการใช้ข้อมูลมาเทรนโมเดลต่อไป
Lenovo รายงานผลการสำรวจความคิดเห็น CIO ทั่วโลก Lenovo Global CIO Report 2024 ซึ่งเป็นการสำรวจปีที่สาม โดยสอบถามจาก CIO 750 คน ใน 10 ประเทศ การสำรวจในปีนี้หลายคำถามเป็นเรื่องเกี่ยวกับ AI
ประเด็นที่น่าสนใจในผลการสำรวจมีดังนี้
ทีมวิจัยนำโดย Global Fishing Watch วิเคราะห์ภาพถ่ายดาวเทียมช่วงปี 2017-2021 ทำให้ได้ข้อมูลการเดินเรือของเรือขนาดใหญ่อย่างละเอียดโดยไม่เคยมีมาก่อน และทำให้รู้ว่าน่านน้ำแต่ละแห่งถูกใช้งานอย่างไรบ้าง
แม้เรือขนส่งจะมีการถ่ายทอดสัญญาณรหัสประจำเรือและตำแหน่งแต่หลายลำก็ไม่ได้เปิดวิทยุเอาไว้ รวมถึงเรือจำนวนมากเป็นการประมงผิดกฎหมาย งานวิจัยใหม่นี้จับภาพถ่ายดาวเทียมและแยกประเภทของเรือแต่ละลำโดยตรงผ่านระบบ machine learning ทำให้เห็นชุดข้อมูลละเอียดและครบถ้วนมากขึ้น
The Information รายงานว่า Alphabet บริษัทของแม่กูเกิล ได้จัดการประชุมในฝ่ายขายโฆษณา ซึ่งตอนนี้มีพนักงานประมาณ 30,000 คน โดย Sean Downey หัวหน้าฝ่ายในอเมริกาบอกว่าจะมีการปรับโครงสร้างทีมฝ่ายขายใหม่ แต่ไม่ได้ระบุว่าจะมีการปลดพนักงานด้วยหรือไม่
แนวทางเบื้องต้นคือการรวมพนักงานในฝ่ายต่าง ๆ และย้ายพนักงานจำนวนหนึ่งไปดูแลส่วนลูกค้ารายใหญ่ที่งบโฆษณาสูงเพิ่มเติม ในรายงานบอกว่ากูเกิลจะผลักดันการใช้ Machine Learning ในการขายโฆษณามากขึ้น ซึ่งช่วยให้ลูกค้าซื้อโฆษณามากขึ้นในทุกแพลตฟอร์มของกูเกิล
ทีม Machine Learning ของแอปเปิลออกเฟรมเวิร์กสำหรับงาน Machine Learning บน Apple Silicon เรียกชื่อว่า MLX (Machine Learning Explore) โดยสามารถดาวน์โหลดได้ผ่าน GitHub
แอปเปิลบอกว่า MLX เป็นเฟรมเวิร์กสำหรับนักพัฒนา ในการรันโมเดล ML ที่ออกแบบมาให้ทำงานได้มีประสิทธิภาพสูงสุด บนอุปกรณ์ที่ใช้ชิป Apple Silicon
กูเกิลประกาศอัพเกรดระบบตัวกรองอีเมลสแปมใน Gmail ซึ่งระบุว่าเป็นการอัพเกรดครั้งใหญ่ที่สุดในรอบหลายปี โดยใช้ระบบแยกแยะคำตัวใหม่ RETVec (Resilient & Efficient Text Vectorizer) ที่มีความสามารถเข้าใจข้อความโฆษณาที่มีการดัดแปลงคำหลบเลี่ยง เช่น ใส่อักขระพิเศษ อีโมจิ สะกดคำผิด ที่ทำให้คนยังอ่านเข้าใจได้ แต่คอมพิวเตอร์อาจไม่เข้าใจ
ตัวอย่างคำที่อีเมลโฆษณาใช้เพื่อหลบ เช่น C0NGRATULATIONS (แทนที่ด้วยเลขศูนย์), Jᴀ̲ᴄ̲ᴋ̲pot ใส่ขีดเส้นใต้ให้จับคู่ด้วย Unicode ปกติไม่ได้ เป็นต้น
Vesuvius Challenge โครงการตั้งรางวัลสำหรับการอ่านม้วนหนังสือ Herculaneum ที่ถูกฝังในเถ้าภูเขาไฟ Vesuvius ที่ระเบิดขึ้นเมื่อ ค.ศ. 79 ประกาศรางวัลแรกให้กับ Luke Farritor นักศึกษาวิทยาศาสตร์คอมพิวเตอร์อายุ 21 ปี ที่สามารถอ่านตัวอักษร 10 ตัวแรกในม้วนหนังสือได้สำเร็จโดยไม่เปิดม้วนหนังสือออกมา ได้รางวัล 40,000 ดอลลาร์
แม้ว่าม้วนหนังสือ Herculaneum จะคลี่ออกมาอ่านไม่ได้แต่ก็มีบางชิ้นที่หลุดออกมาเอง และก่อนหน้านี้ทีมวิจัยของศาสตราจารย์ Brent Seales พบหมึกที่ใช้เขียนข้อความจากภาพ CT-scan ทำให้มีความหวังว่าจะอ่านข้อความในม้วนหนังสือได้โดยไม่ต้องแกะม้วนออกมา ดูภาพสแกนและพบรอยแตกของม้วนหนังสือเป็นรอยจากการเขียนตัวอักษร
DigitalOcean ประกาศซื้อกิจการ Paperspace ผู้ให้บริการคลาวด์โครงสร้างพื้นฐาน IaaS เน้นรองรับแอพพลิเคชันที่ต้องการสเกลการใช้งานจีพียูโดยเฉพาะ ซึ่ง DigitalOcean มองว่าดีลนี้จะนำมาเสริมกับบริการคลาวด์ที่มีอยู่แล้ว เพื่อรองรับการใช้งานด้าน AI และ Machine Learning มากขึ้น
มูลค่าของดีลนี้อยู่ที่ 111 ล้านดอลลาร์ โดย DigitalOcean จะจ่ายเป็นเงินสดทั้งหมด คาดว่าดีลจะแล้วเสร็จได้ภายในปีการเงิน 2023
ปัจจุบันอุตสาหกรรมเพลงกำลังเติบโต มีการเปิดตัวเพลงใหม่ขึ้นหลายหมื่นเพลง จึงเป็นเรื่องยากสำหรับบริการสตรีมมิ่งเพลงและสถานีวิทยุที่จะเพิ่มเพลงที่ผู้ฟังน่าจะชอบลงในเพลย์ลิสต์ของตน โดยปกติแล้วบริการเหล่านี้จะใช้วิธีเลือกเพิ่มเพลงโดยอาศัยรสนิยมของผู้ฟังและ ใช้ AI วิเคราะห์และช่วยเลือกเพลงให้
นักวิจัยสหรัฐฯ จึงพัฒนาโมเดล Machine Learning ที่ใช้กับการตอบสนองของระบบประสาท ของผู้ฟังกลุ่มตัวอย่างที่ถูกวัดคลื่นสมองระหว่างฟังเพลง เพื่อคาดการณ์ว่าเพลงจะฮิตหรือไม่ ด้วยความแม่นยำที่สูงถึง 97% โดยวัดจากเพลงที่มียอดสตรีมมิ่งสูง ซึ่งในอนาคตวิธีนี้อาจใช้คาดการ์ณกับความบันเทิงประเภทอื่นๆได้ เช่น ภาพยนตร์และรายการทีวี
Allen Institute of Artificial Intelligence หน่วยงานไม่แสวงหากำไรที่เน้นงานวิจัยด้านปัญญาประดิษฐ์ ซึ่งก่อตั้งโดย Paul Allen ผู้ร่วมก่อตั้งไมโครซอฟท์ หรือที่เรียกย่อว่า AI2 ประกาศแต่งตั้ง Ali Farhadi เป็นซีอีโอคนใหม่ของหน่วยงาน
ก่อนหน้านี้ Ali Farhadi ทำงานเป็นผู้บริหารในแอปเปิลส่วนการพัฒนา Machine Learning รุ่นใหม่ ซึ่งเขาร่วมงานกับแอปเปิลจากดีลขายกิจการ Xnor․ai ในปี 2020 อย่างไรก็ตามการมาเป็นซีอีโอ AI2 ก็เป็นการกลับสู่ที่เดิม เพราะ Xnor.ai เคยเป็นบริษัทในโครงการบ่มเพาะสตาร์ทอัพของ AI2 นั่นเอง
ในคีย์โน้ตของงาน WWDC23 ที่ผ่านมา มีข้อสังเกตว่าแม้แอปเปิลจะเปิดตัวเฮดเซต Apple Vision Pro ที่ใช้งานโลกเสมือนผสมผสาน Mixed Reality (MR) แต่ในการนำเสนอนั้น กลับไม่มีคำว่า Metaverse ออกมาแม้แต่ครั้งเดียว
คำพูดที่ Tim Cook ซีอีโอแอปเปิล และผู้นำเสนอคนอื่นใช้บ่อยครั้งคือการพูดถึงยุคสมัยใหม่ของ Spatial Computing มากกว่า ซึ่งนิยามก็คือการกระทำและโต้ตอบกันระหว่างเครื่องจักร บุคคล วัตถุ และสภาพแวดล้อมบริเวณนั้น
กูเกิลเผยสถิติการต่อสู้กับ "ข้อมูลปลอม" ใน Google Maps ที่เปิดให้ผู้ใช้คนไหนก็ได้สามารถอัพเดตข้อมูลสถานที่และแผนที่ได้
เทคนิคของกูเกิลต่างจาก OpenStreetMap ที่ใช้แรงคนคอยตรวจสอบ โดยใช้โมเดล machine learning เข้ามาช่วยตรวจจับด้วย ล่าสุดกูเกิลยังอัพเดตโมเดล AI ตัวใหม่ให้ตรวจจับข้อมูลปลอมเหล่านี้ได้เร็วและมีประสิทธิภาพกว่าเดิม
แพทเทิร์นใหม่ที่กูเกิลพบคือการสร้างโปรไฟล์ธุรกิจปลอมโดยใช้โดเมน .design หรือ .top และการอัพโหลดรูปที่มีเบอร์โทรปลอมๆ ลงในรูป เพื่อล่อให้คนที่ค้นหาธุรกิจโทรไปยังเบอร์ปลอมเหล่านี้แทนเบอร์จริง ซึ่งโมเดลตัวใหม่ของกูเกิลตรวจจับได้
สถิติการตรวจจับของปี 2022 มีดังนี้
โครงการ PyTorch (ที่ปัจจุบัน Meta ยกให้ Linux Foundation ไปดูแลต่อแล้ว) เปิดตัว PyTorch 2.0 เวอร์ชันอัพเกรดครั้งใหญ่ที่รอคอยกันมานาน และทดสอบแบบพรีวิวมาสักระยะหนึ่งแล้ว
ฟีเจอร์ใหม่ที่สำคัญที่สุดคือ torch.compile ที่เป็น API หลักตัวใหม่ของ PyTorch ที่ช่วยเพิ่มประสิทธิภาพของโมเดล (เฉลี่ย 21% บนทศนิยม Float32 และ 51% บนทศนิยม AMP/Float16) และจะเป็นแกนหลักของ PyTorch ซีรีส์ 2.x ต่อไปในอนาคต ตอนนี้ torch.compile ยังเป็น "ตัวเลือก" (optional) เลือกใช้ได้ตามต้องการ และเข้ากันได้กับโค้ดเก่า 100%
Hewlett Packard Enterprise หรือ HPE ประกาศซื้อกิจการ Pachyderm สตาร์ทอัพที่พัฒนาซอฟต์แวร์แบบโอเพนซอร์ส สำหรับสร้าง Machine Learning Pipeline แบบอัตโนมัติ เพื่อใช้ในงานแอพพลิเคชัน AI ทั้งนี้ดีลดังกล่าวไม่มีการเปิดเผยมูลค่าที่เข้าซื้อ
Justin Hotard รองประธานและผู้จัดการทั่วไปส่วนธุรกิจ HPC และ AI ของ HPE พูดถึงดีลดังกล่าวว่าโครงการ AI ในองค์กรมีความซับซ้อนและขนาดข้อมูลที่ใหญ่ขึ้นเรื่อย ๆ นักวิทยาศาสตร์ข้อมูลมีความต้องการสร้างโซลูชัน AI ที่จัดการ Machine Learning อย่างมีประสิทธิภาพ และใช้ต้นทุนโครงสร้างพื้นฐานน้อยที่สุด ซึ่งซอฟต์แวร์ของ Pachyderm มีจุดเด่น รองรับข้อมูลทุกรูปแบบในงาน AI
ทีม TensorFlow ประกาศแผนการออกเวอร์ชันใหญ่รุ่นหน้า (น่าจะเรียกว่า TensorFlow 3 นับต่อจาก TensorFlow 2.x ในปัจจุบัน เวอร์ชัน 2.0 ออกเมื่อปี 2019) โดยมีกำหนดออกรุ่นพรีวิวในไตรมาส 2/2023 และออกรุ่นจริงภายในปี 2023
ทีม TensorFlow การันตีว่าโค้ดเก่าทั้งหมดของ TensorFlow 2 จะเข้ากันได้กับเวอร์ชันใหม่ 100% ไม่ต้องแก้หรือแปลงโค้ดของเก่าใดๆ นำมารันได้ทันที
ของใหม่ใน TensorFlow เวอร์ชันถัดไป แบ่งออกเป็น 4 หมวด ได้แก่
SiFive บริษัทผู้ผลิตซีพียู RISC-V ชื่อดัง เปิดเผยว่าซีพียูของตัวเองรุ่น SiFive Intelligence X280 ถูกนำไปใช้ในศูนย์ข้อมูลของกูเกิล เพื่อช่วยเร่งการประมวลผล AI/ML แล้ว
สิ่งที่กูเกิลทำคือนำ X280 ไปรันคู่กับหน่วยประมวลผล Tensor Processing Unit (TPU) ของตัวเอง เพื่อแบ่งเบาภาระงานบางอย่างออกจากหน่วยประมวลผลหลัก
ซีพียู SiFive X280 มีส่วนขยายชุดคำสั่งแบบเวกเตอร์ และรองรับการรวมรีจิสเตอร์เวกเตอร์เข้าด้วยกัน (รีจิสเตอร์ 512-bit x 32 ตัว) เพื่อให้ได้เวกเตอร์ยาวขึ้น (สูงสุดเป็น 4096 บิต) รวมถึงมีชุดคำสั่งคัสตอมสำหรับงาน AI/ML โดยเฉพาะด้วย จึงช่วยให้งานประมวลผล AI/ML มีประสิทธิภาพดีขึ้น
บริษัท Meta ประกาศยกโครงการ PyTorch เฟรมเวิร์คสำหรับงาน AI ให้กับ Linux Foundation ไปดูแลต่อ
Linux Foundation จะตั้งองค์กรลูก PyTorch Foundation โดยมีตัวแทนจากบริษัทอื่นๆ ในอุตสาหกรรม ได้แก่ AMD, Amazon Web Services, Google Cloud, Meta, Microsoft Azure, Nvidia ร่วมเป็นคณะกรรมการกำกับดูแลทิศทางการพัฒนา PyTorch ต่อไป
PyTorch เริ่มพัฒนาในปี 2016 โดยเป็นการต่อยอดจากเฟรมเวิร์ค Torch ที่เขียนด้วยภาษา Lua แต่ปรับให้เป็นภาษา Python ที่ใช้งานกว้างขวางกว่าแทน (โครงการ Torch ก็หยุดพัฒนาไปตั้งแต่ปี 2018) ถือเป็นเฟรมเวิร์ค machine learning ยอดนิยมอีกตัวเคียงคู่กับ TensorFlow/Keras ที่สร้างโดยฝั่งกูเกิล