มีรายงานจาก The Wall Street Journal พูดถึงแผนการพัฒนา AI ผู้ช่วยตัวใหม่ของ Meta บริษัทแม่ของ Facebook และ Instagram โดยมีเป้าหมายให้ความสามารถสูงกว่าโมเดล Llama 2 ที่เปิดตัวเมื่อสองเดือนที่แล้ว และสามารถแข่งขันกับ GPT-4 ของ OpenAI ได้
แผนการเทรนโมเดลใหม่ดังกล่าวจะเริ่มในต้นปี 2024 เนื่องจาก Meta จะใช้เซิร์ฟเวอร์ประมวลผลในศูนย์ข้อมูลตนเองทั้งหมด แตกต่างจาก Llama 2 ที่ใช้ทรัพยากรของ Azure จากไมโครซอฟท์ ซึ่งตอนนี้บริษัทก็รับสมัครพนักงานที่เกี่ยวข้อง รวมถึงสั่งซื้อจีพียู H100 จาก NVIDIA จำนวนมากอีกด้วย
Amazon ปรับปรุงเงื่อนไขการเผยแพร่ผลงานหนังสือผ่าน Kindle Direct Publishing (KDP) หลังจากกลุ่มนักเขียนในสหรัฐร้องเรียนว่าคอนเทนต์หนังสือ ที่ใช้ AI สร้างขึ้นมาทั้งหมดมีจำนวนเพิ่มขึ้นมาก จนกระทบกับการค้นหางานเขียนที่คนแต่ง
OpenAI ขึ้นข้อมูลในหน้าเว็บสำหรับบุคลากรภาคการศึกษา (โดยเฉพาะครู-อาจารย์) ยอมรับว่าระบบตรวจสอบว่าการบ้านหรืองานเขียนของนักเรียนทำด้วย AI หรือไม่ นั้นไม่สามารถตรวจจับได้
เนื้อหาส่วนนี้เป็นคำถามว่า Do AI detectors work? ซึ่งคำตอบของ OpenAI คือ "In short, no." และขยายความว่าแม้บริษัทหลายแห่งซึ่งรวม OpenAI ด้วย พยายามออกตัวตรวจจับมาก็ตาม แต่ไม่มีระบบตัวไหนทำงานได้น่าเชื่อถือมากเพียงพอ
OpenAI ยังเตือนว่าระบบ ChatGPT ของตัวเองไม่มี "ความรู้" ว่าคอนเทนต์ที่ป้อนเข้าไปอาจสร้างด้วย AI ได้ หากผู้ใช้พบคำถามกลับของ ChatGPT ในแนวว่า "เขียนด้วย AI หรือเปล่า?" ให้พึงระลึกว่าเป็นคำถามแบบสุ่มมั่วๆ ไม่ได้แปลว่า ChatGPT ตรวจจับได้
Jensen Huang ซีอีโอของ NVIDIA ไปเยือนอินเดีย ได้เข้าพบนายกรัฐมนตรี Narendra Modi และประกาศความร่วมมือกับบริษัทยักษ์ใหญ่ของอินเดีย 2 ราย ได้แก่ Reliance Industries และ Tata Group
กรอบความร่วมมือกว้างๆ บอกเพียงว่าทั้งสองบริษัทจะสั่งซื้อ ชิป NVIDIA GH200 Grace Hopper Superchip มาสร้างซูเปอร์คอมพิวเตอร์ประมวลผล AI ในอินเดีย
กรณีของ Reliance Industries ซึ่งเป็นบริษัทแม่ของ Reliance Jio Infocomm โอเปอเรเตอร์อันดับหนึ่งของอินเดียยุคปัจจุบันด้วย ต้องการพัฒนาบริการเพื่อลูกค้าของ Jio จำนวน 450 ล้านคน โดยเครื่องเซิร์ฟเวอร์เหล่านี้จะให้บริการนักวิจัย นักพัฒนา สตาร์ตอัพในอินเดียด้วย
กลุ่มฟินเทค Ant Group เปิดตัวโมเดล AI สร้างเนื้อหาหรือ Generative AI สำหรับสายการเงินโดยเฉพาะ ซึ่ง Ant เรียกว่า Financial LLM โดยมาพร้อมกับแอพพลิเคชันทางการเงินที่ใช้โมเดลดังกล่าวคือ Zhixiaobao 2.0 ผู้ช่วยทางการเงินสำหรับลูกค้าบุคคล และ Zhixiaozhu 1.0 ผู้ช่วยทางการเงินสำหรับลูกค้าสถาบันการเงิน
โดย Zhixiaobao 2.0 จะเข้ามาช่วยทั้งการแนะนำการจัดพอร์ตการลงทุน การกระจายสินทรัพย์ลงทุน ตลอดจนให้ความรู้ทางการเงิน ขณะที่ Zhixiaozhu 1.0 จะมาช่วยในงานการเป็นที่ปรึกษาการลงทุน อ่านบทวิเคราะห์การลงทุน ประเมินโอกาสทางการลงทุน และช่วยสร้างเนื้อหาบทวิเคราะห์
Anthropic บริษัท AI ที่ก่อตั้งโดยอดีตพนักงาน OpenAI และได้รับการสนับสนุนจากกูเกิล เปิดตัวบริการ Claude Pro เพื่อรันโมเดล Claude แบบไม่โดนจำกัดปริมาณใช้งานเหมือนรุ่นปกติ เทียบเท่ากับ ChatGPT Plus ของฝั่ง OpenAI และคิดราคาเท่ากันเป๊ะคือ 20 ดอลลาร์ต่อเดือน
Claude Pro สามารถใช้งานโมเดลได้เยอะกว่าเวอร์ชันฟรี 5 เท่า และมีคิวพิเศษให้รันโมเดลได้ก่อนในช่วงผู้ใช้งานเยอะๆ รวมถึงได้สิทธิลองใช้ฟีเจอร์ใหม่ก่อนคนทั่วไปด้วย
Google เป็นอีกหนึ่งเจ้าที่นำ Generative AI มาใช้กับบริการของตัวเอง ล่าสุดประกาศนำมาใช้กับคีย์บอร์ดของตัวเองอย่าง Gboard แล้ว โดยเป็นการนำ Generative AI มาใช้พิสูจน์อักษรในชื่อฟีเจอร์ Proofread ซึ่งปล่อยบน Gboard เวอร์ชันเบต้า 13.4
The Information มีรายงานล่าสุดเกี่ยวกับโครงการพัฒนาแชตบอท AI ของแอปเปิล ที่ใช้งานกันภายในบริษัท ซึ่งมีชื่อเล่นว่า Ajax GPT บอกว่าตอนนี้โครงการใช้เงินระดับหลายล้านดอลลาร์ต่อวัน ในการพัฒนาและเทรนโมเดล ขนาดมากกว่า 2 แสนล้านพารามิเตอร์
โมเดลที่พัฒนาตอนนี้มีคำเรียกภายในว่า Foundational Models มีทีมงานประมาณ 16 คน บางคนเป็นอดีตวิศวกรของกูเกิล โดย John Giannandrea รองประธานอาวุโสดูแลด้าน AI เป็นผู้ดูแลทีมนี้ (ซึ่งเขาก็เคยทำงานกูเกิล)
TII (หรือ Technology Innovation Institute) เป็นสถาบันเทคโนโลยีของอาบูดาบี ได้เปิดตัวโมเดล Falcon ที่ขนาด 180 พันล้านพารามิเตอร์ ในชื่อ Falcon 180B ที่ถูกฝึกบนชุดข้อมูลกว่า 3.5 ล้านล้านโทเคน (จำนวนหน่วยย่อยของคำในทางงานประมวลผลภาษาธรรมชาติ) บนการ์ดจอ 4,096 ตัว ด้วยเวลาประมาณ 7,000,000 ชั่วโมงของการ์ดจอ หลังจากที่เคยเปิดตัว Falcon 40B มาก่อนโดน Llama 2 แซงในเวลาต่อมาด้วยขนาด 70 พันล้านพารามิเตอร์ที่ใหญ่กว่า
มีรายงานเพิ่มเติมเกี่ยวกับข้อกำหนดความเป็นส่วนตัวในการใช้งาน ของแพลตฟอร์ม X หรือ Twitter จากก่อนหน้านี้ มีผู้พบการเปลี่ยนแปลง โดยระบุว่าจะเก็บข้อมูล Biometric และข้อมูลการสมัครงานผ่าน X Hiring คราวนี้เป็นเรื่องของ AI
โดยเนื้อหาที่แก้ไขในข้อ 2.1 เกี่ยวกับการปรับปรุงเนื้อหาเฉพาะผู้ใช้งานแต่ละคน บอกว่าแพลตฟอร์มอาจรวบรวมข้อมูลที่เป็นสาธารณะ มาใช้เทรนโมเดล Machine Learning หรือ AI ตามวัตถุประสงค์ในขอบเขตที่ระบุในข้อกำหนดนี้
We may use the information we collect and publicly available information to help train our machine learning or artificial intelligence models for the purposes outlined in this policy.
ทีมนักวิจัยจาก University of Zurich ประเทศสวิตเซอร์แลนด์เผยแพร่ผลงาน นำโดรนมาฝึกเรียนรู้ AI ทำให้สามารถบินในสนามแข่งบินโดรนและเอาชนะโดรนที่มีผู้ควบคุมระดับแชมป์โลกได้ โดยผลการแข่งขันใน 25 รอบ โดรนสามารถเอาชนะมนุษย์ได้ 15 รอบ
Elia Kaufmann หัวหน้าทีมวิจัยโครงการนี้ บอกว่ากระบวนการเทรนโดรนนั้น ใช้การรู้จำลักษณะของรั้วหรือสิ่งกีดขวางที่มีในสนามแข่งจากเซตรูปภาพ และเรียนรู้การบินในทิศทางและตำแหน่งต่าง ๆ แบบ Reinforcement ซึ่งทั้งหมดทำบนสนามแข่งแบบเสมือน จนกระทั่งโค้ดถูกเรียนรู้แก้ไขได้แนวทางการเคลื่อนที่ดีและเร็วที่สุด
ซัมซุงเปิดตัว Samsung Food แพลตฟอร์มผู้ช่วย AI สำหรับช่วยคิดสูตรอาหาร ในเบื้องต้นรองรับการทำงาน 8 ภาษา เช่น ภาษาอังกฤษ เกาหลี สเปน เยอรมนี แต่ยังไม่มีภาษาไทย รองรับการทำงานใน 104 ประเทศ
Samsung Food เรียนรู้ข้อมูลจากสูตรอาหารมากกว่า 160,000 สูตร ออกมาเป็น AI ที่ช่วยแนะนำสูตรอาหารที่เหมาะสมตามเงื่อนไขของผู้ใช้งาน ตลอดจนวัตถุดิบแนะนำตามฤดูกาล มีข้อมูลโภชนาการ ช่วยวางแผนเมนูอาหารแต่ละวัน จัดรายการสั่งซื้อของเข้าตู้เย็น ตลอดจนเชื่อมต่อกับอุปกรณ์ในระหว่างขั้นตอนการปรุงได้ด้วย
แอป Samsung Food สามารถดาวน์โหลดได้แล้วทาง https://get.samsungfood.com/download
Google Cloud เปิดตัวชิปประมวลผลปัญญาประดิษฐ์ Cloud TPU v5e เวอร์ชันใหม่ที่อัพเกรดจาก TPU v4 ซึ่งเริ่มใช้มาตั้งแต่ปี 2020
ตอนนี้ยังมีรายละเอียดของ TPU v5e ออกมาไม่มากนัก แต่มันเป็น TPU เวอร์ชันคัสตอม (ตัวท้าย e) ที่เน้นประสิทธิผลเรื่องต้นทุน (cost-efficiency) กว่า TPU รุ่นปกติ จากตัวเลขของกูเกิลระบุว่ามีประสิทธิภาพต่อดอลลาร์ในการเทรนโมเดล LLM ดีกว่า TPU v4 สูงสุดราว 2 เท่า และประสิทธิภาพต่อดอลลาร์ในการรันโมเดลดีกว่าสูงสุด 2.5 เท่า
Google Cloud ประกาศเพิ่มฟีเจอร์ AlloyDB AI ทำให้สามารถใช้ฟีเจอร์ด้านปัญญาประดิษฐ์จากในฐานข้อมูลได้ง่ายขึ้น โดยมีสองฟีเจอร์สำคัญ คือ
Google Cloud มีบริการเช่ารันโมเดล AI ชื่อ Vertex AI ที่ให้บริการมาสักระยะหนึ่งแล้ว และเปิดบริการโมเดล Generative AI เมื่อเดือนพฤษภาคมที่ผ่านมา โดยมีทั้งโมเดลของกูเกิลเอง และโมเดลจากบริษัทอื่นด้วย กูเกิลเรียกบริการนี้ว่า Model Garden
ล่าสุดในงาน Google Cloud Next '23 เมื่อคืนนี้ กูเกิลประกาศเพิ่มโมเดลของพาร์ทเนอร์อีกหลายตัว ได้แก่
Google DeepMind เปิดตัว Synth ID ระบบลายน้ำฝังลงในภาพที่สร้างด้วย AI เพื่อยืนยันว่าเป็นภาพที่ไม่ได้สร้างโดยมนุษย์ ป้องกันปัญหาภาพปลอม-บิดเบือนเหตุการณ์จริง สามารถตรวจสอบย้อนกลับได้
กูเกิลประกาศฟีเจอร์นี้ตั้งแต่งาน Google I/O 2023 และออกผลงานจริงมาเป็น Synth ID ที่พัฒนาโดยทีม DeepMind ร่วมกับ Google Research
กูเกิลประกาศว่าบริการ Duet AI ที่นำความสามารถของ Generative AI มาใช้กับบริการของ Google Workspace ตอนนี้เปิดให้สำหรับผู้ใช้งานทุกคนแล้ว
ในประกาศนี้กูเกิลยังนำ Duet AI มาใส่ใน Google Meet โดยนอกจากระบบจัดการภาพและเสียง ยังมีฟีเจอร์อื่นดังนี้
นอกจาก Google Meet กูเกิลยังประกาศนำความสามารถด้าน Generative AI ของ Duet AI มาเพิ่มในบริการ Google Chat ด้วยเช่นกัน
โดย Google Chat จะทำงานโดยมี Duet AI ทำหน้าที่เป็นแชทบอตหนึ่งในลิสต์สำหรับสนทนาโต้ตอบ ซึ่งมีความสามารถช่วยอัพเดต ค้นหาข้อมูล ตลอดจนให้คำแนะนำคำตอบ ผ่านการค้นหาเนื้อหาจากข้อความในอดีต และไฟล์ในแพลตฟอร์ม Google Workspace ซึ่งจะช่วยให้การทำงานต่อเนื่องและมีประสิทธิภาพมากขึ้น
ในหน้าแชทรวมยังปรับปรุงหมวดหมู่แบ่งเป็น Home รวมทุกข้อความ, Mentions รวมแชทที่ถูกระบุถึง และ Starred โดยปรับฟอนต์และสีพื้นหลัง เพื่อให้มองหาข้อความได้สะดวกมากขึ้น
Yahoo Mail ประกาศเพิ่มความสามารถด้าน AI หลังจากทดสอบในสถานะเบต้ากับผู้ใช้ iOS ซึ่งตอนนี้ขยายมากลุ่มผู้ใช้งานผ่านเบราว์เซอร์ด้วย โดยมีฟีเจอร์เด่นรองรับการช้อปปิ้ง
ความสามารถใหม่ที่เพิ่มเข้ามาชื่อว่า Shopping Saver ซึ่งจะค้นหาโค้ดและบัตรของขวัญในอินบอกซ์ เพื่อดูว่ามีเครดิตส่วนไหนที่ยังไม่ได้ใช้ และจะแนะนำเมื่อร่างอีเมลเพื่อเตือนให้ใช้งานโค้ดส่วนนี้
นอกจากนี้ Yahoo Mail ยังเพิ่มและปรับปรุงความสามารถใหม่เกี่ยวกับ AI ซึ่งรองรับด้วยเทคโนโลยีของ Google Cloud เช่น ระบบเสิร์ชที่รองรับประโยคคำถาม ระบบแนะนำการเขียนอีเมลในฟอร์แมตที่ต้องการ และตัวช่วยสรุปเนื้อหาอีเมล
ที่มา: Yahoo
Ideogram AI สตาร์ตอัพปัญญาประดิษฐ์วาดภาพเปิดตัวต่อคนทั่วไปแบบจำกัดผู้ใช้ ความสามารถสำคัญคือปัญญาประดิษฐ์ของ Ideogram นั้นมีความเข้าใจคำสั่งได้ละเอียด สามารถเรนเดอร์ภาพและข้อความตามคำสั่งได้
ทีมงานของ Ideogram รวมตัวมาจากนักวิจัยด้านปัญญาประดิษฐ์หลายบบริษัท ทั้งมหาวิทยาลัยดังและทีมงานอย่าง Google Brain ตอนนี้บริษัทได้ทุนตั้งต้นมาแล้ว 16.5 ล้านดอลลาร์
ที่มา - Ideogram AI
Alibaba Cloud เปิดตัวโมเดลภาษาภาพขนาดใหญ่ (Large Vision Language) แบบโอเพนซอร์ส ซึ่งมีความสามารถในการเข้าใจภาพและตัวหนังสือ
สองโมเดลได้แก่ Qwen-VL เป็นโมเดลภาษาภาพขนาดใหญ่ที่ถูกเทรนมาก่อน และ Qwen-VL-Chat โมเดลสำหรับการสนทนาโต้ตอบ ขนาด 7 พันล้านพารามิเตอร์ มีความสามารถทำความเข้าใจภาพในภาษาอังกฤษและภาษาจีน และสร้างบทสนทนาโต้ตอบ รวมถึงทำงานประมวลผล เช่น บวกเลขในภาพได้ ซึ่งสามารถนำมาช่วยทั้งการอ่านป้ายภาษาจีน สำหรับคนที่ไม่รู้ภาษาจีน หรือใช้ช่วยอ่านป้ายต่าง ๆ สำหรับผู้มีปัญหาการมองเห็น
ทั้ง Qwen-7B และ Qwen-7B-Chat เปิดให้ดาวน์โหลดใช้งานแล้วที่ ModelScope ซึ่งเป็นชุมชนนักพัฒนา AI ของ Alibaba Cloud และที่ Hugging Face
Hugging Face สตาร์ทอัพแพลตฟอร์มที่โฟกัสด้าน AI สำหรับนักพัฒนาโดยเฉพาะ ประกาศรับเงินเพิ่มทุน 235 ล้านดอลลาร์ ทำให้มูลค่ากิจการเพิ่มเป็น 4,500 ล้านดอลลาร์ ซึ่งประเด็นน่าสนใจคือรายชื่อผู้ร่วมลงทุนในรอบนี้เป็นบริษัทด้านเทคโนโลยีชื่อดังได้แก่ Google, Amazon, NVIDIA, Salesforce, AMD, Intel, IBM และ Qualcomm
บริการของ Hugging Face อาจพูดได้ว่าเป็น GitHub เวอร์ชันที่เน้นงาน AI โดยชุมชนนักพัฒนาสามารถแชร์โค้ด โมเดล ชุดข้อมูล เพื่อให้การสร้างโมเดล AI ทำได้ง่ายขึ้น จุดเด่นของ Hugging Face คือการรวมชุดข้อมูล โมเดล AI ให้นักพัฒนาเลือกนำมาเทรนหรือต่อยอดสร้างโมเดล AI ของตนเองได้สะดวกขึ้น และแพลตฟอร์มเองก็มีโมเดล AI ที่พัฒนาขึ้นมาให้ใช้งานด้วย
ในงาน TechTour.MY อินเทลพูดถึงการบุกตลาดปัญญาประดิษฐ์ ว่ายังมีโอกาสที่อินเทลจะบุกตลาดปัญญาประดิษฐ์่ว่าตลาดกว้างกว่าการใช้ชิปพลังประมวลผลสูงๆ มาฝึกปัญญาประดิษฐ์ขนาดใหญ่มาก และอินเทลยังน่าจะบุกตลาดเหล่านั้นได้
Alexis Crowell ผู้จัดการทั่วไปฝ่ายโซลูชั่นเทคโนโลยี, ซอฟต์แวร์, และบริการของ Intel Asia Pacific พูดถึงการประมวลผลปัญญาประดิษฐ์ว่ายังมีงานขนาดเล็กที่ใช้งานกับชิปอื่นๆ นอกจาก GPU หรือแม้แต่งานแบบ LLM ที่อินเทลยังคงพยายามผลักดัน Gaudi2 โดย Crowell ระบุว่าตลาดกำลังเติบโตอย่างรวดเร็วมาก ทำให้น่าจะมีพื้นที่ให้ผู้ผลิตชิปหลายรายในตลาด
Meta ปล่อย Code Llama โมเดลปัญญาประดิษฐ์ที่พัฒนาต่อจาก Llama2 มาฝึกกับซอร์สโค้ดขนาด 500 ล้านโทเค็น ได้โมเดลทั้งแบบเติมโค้ดปกติ, แบบรับคำสั่ง, และโมเดลฝึกเฉพาะกับโค้ด Python
ผลทดสอบการเขียนโค้ด HumanEval นั้น Code Llama ขนาด 34B ได้คะแนนดีกว่าโมเดลอื่นๆ ทั้งหมด รวมถึง GPT-3.5 หรือ ChatGPT ด้วย เป็นรองเพียง GPT-4 เท่านั้น ขณะที่โมเดลขนาดรองลงมา เช่น 7B และ 13B ก็ยังทำคะแนนได้ดีและตอบสนองเร็วกว่ามาก
กระบวนการฝึก Code Llama นั้นเน้นถึงการเติมโค้ดตรงกลางเพิ่มเข้ามา เนื่องจากการใช้งานมักต้องใช้สำหรับ code completion ด้วย และต้องฝึกให้ขยาย context จาก 4K เป็น 100K เพื่อให้เพียงพอสำหรับการเขียนโค้ดขนาดใหญ่ๆ
Meta เปิดตัว SeamlessM4T โมเดล AI แบบ multilingual multimodal สำหรับการแปลภาษาทั้งเสียงพูดและข้อความ รองรับเกือบ 100 ภาษา ภายใต้สัญญาอนุญาต CC BY-NC 4.0 สามารถนำไปใช้งานได้สำหรับการวิจัย
ความสามารถของ SeamlessM4T สามารถรับรู้เสียงได้เกือบ 100 ภาษา, แปลภาษาจากเสียงพูดเป็นตัวหนังสือ ได้เกือบ 100 ภาษา, แปลเสียงพูดเป็นเสียงพูด ด้วยอินพุทเกือบ 100 ภาษา และเอาท์พุท 36 ภาษา และแปลจากตัวหนังสือเป็นตัวหนังสือได้เกือบ 100 ภาษา