บริษัทเอกชนและหน่วยงานวิจัยจำนวน 50 แห่ง นำโดย IBM และ Meta ประกาศตั้งกลุ่ม AI Alliance เพื่อกำหนดมาตรฐานของวงการ AI ร่วมกัน โดยเน้นการเปิดกว้างและความโปร่งใส (open and transparent)
เป้าหมายของ AI Alliance มีตั้งแต่พัฒนาเบนช์มาร์ควัดผล AI โดยเฉพาะในด้านความปลอดภัย, พัฒนาโมเดลพื้นฐาน (foundation model) แบบเปิดกว้าง, พัฒนาชิปเร่งการประมวลผล AI, ร่วมกับภาคการศึกษาเพื่อพัฒนาทักษะ อบรม เผยแพร่เอกสารความรู้ต่างๆ
ตัวอย่างบริษัทที่เป็นสมาชิกได้แก่ AMD, Cerebras, Dell Technologies, Hugging Face, Intel, Oracle, Red Hat, ServiceNow, Sony, Stability AI
ไมโครซอฟท์ประกาศความสามารถใหม่ที่จะเพิ่มเข้ามาใน Copilot เร็ว ๆ นี้ มีรายละเอียดดังนี้
รัฐบาลสิงคโปร์ ประกาศแผนยุทธศาสตร์ปัญญาประดิษฐ์แห่งชาติ (Singapore National AI Strategy หรือ NAIS) ฉบับที่สอง หลังจากออกแผนฉบับแรกมาตั้งแต่ปี 2019
แผนยุทธศาสตร์ฉบับนี้มองว่า AI เปลี่ยนสถานะจากสิ่งที่ควรมีมาสู่สิ่งที่จำเป็น (From Opportunity
to Necessity) เปลี่ยนจากโครงการแยกย่อยมาเป็นระบบ (From Projects to Systems) และเปลี่ยนจากเรื่องเฉพาะประเทศมาเป็นเรื่องระดับโลก (From Local to Global)
ทีมวิจัยจาก UC San Diego รายงานผลการทดสอบประสิทธิภาพของปัญญาประดิษฐ์ในการหลอกมนุษย์ว่าเป็นมนุษย์ หรือที่รู้จักกันในชื่อ Turing Test โดยผลเบื้องต้นพบว่า GPT-4 มีคะแนนใกล้คนที่สุด
การทดลองครั้งนี้อาศัยบริการออนไลน์ โดยผู้เล่นจะเข้าไปรอคิวในระบบที่มี AI ที่ทีมงานเตรียม prompt ของ AI ทั้ง GPT-3.5 และ GPT-4 เอาไว้รวม 25 ตัว โดยยังมี ELIZA โปรแกรมแชตที่พยายามคุยเหมือนมนุษย์ที่ออกมาตั้งแต่ปี 1966 มาเป็นตัวเทียบด้วย ผู้เล่นที่ทำหน้าที่ผู้ตัดสินจะต้องตัดสินว่ากำลังคุยกับปัญญาประดิษฐ์ภายใน 5 นาที โดยคุยแต่ละข้อความไม่เกิน 300 ตัวอักษร ระบบจะสุ่มว่าผู้เล่นแต่ละคนนั้นจะได้คุยกับปัญญาประดิษฐ์หรือมนุษย์
เว็บไซต์ Quartz ตั้งข้อสังเกตว่าอีโมจิ ✨ (sparkles) กลายเป็นโลโก้อย่างไม่เป็นทางการของวงการ Generative AI ไปเรียบร้อยแล้ว โดยบริษัทไอทียักษ์ใหญ่หลายรายมักใช้อีโมจินี้เป็นสัญลักษณ์ของฟีเจอร์ AI ที่เพิ่มเข้ามาในปีนี้ เช่น Google ที่ใช้กับ Bard/Google Workspace, Zoom AI Companion, Spotify Smart Shuffle หรือแม้แต่ OpenAI ที่ใช้สัญลักษณ์นี้กับ ChatGPT Plus แบบเสียเงิน เป็นต้น
เหตุผลที่อีโมจิ ✨ ถูกนำมาใช้กับ AI น่าจะเป็นเพราะสะท้อนความหมาย "มหัศจรรย์" (magical) ทำงานได้ราวกับมีเวทย์มนตร์ หากให้เทียบกับกรณีในอดีตน่าจะคล้ายการใช้ตัว i เล็กเพื่อบ่งบอกฟีเจอร์เกี่ยวกับอินเทอร์เน็ต (เช่น iPod) และยังสืบทอดมาจนถึงยุค iPhone/iPad ในทุกวันนี้
เว็บไซต์ The Information รายงานข่าวลือว่า Gemini โมเดลปัญญาประดิษฐ์ตัวใหม่ของกูเกิล อาจต้องเลื่อนการเปิดตัวออกไป จากเดิมที่มีแผนเปิดตัวสัปดาห์หน้า กลายเป็นเดือนมกราคม 2024
Gemini เป็นปัญญาประดิษฐ์ที่กูเกิลหวังใช้ต่อกรกับ GPT ของ OpenAI โดยต้องใช้พลัง Google + DeepMind ทำงานร่วมกัน และมีข่าวว่า Sergey Brin กลับมาช่วยโปรเจคนี้ด้วยตัวเอง
Google DeepMind เปิดตัวปัญญาประดิษฐ์สาย deep learning ตัวใหม่ชื่อ Graph Networks for Materials Exploration (GNoME ไม่เกี่ยวอะไรกับเดสก์ท็อป GNOME) สร้างขึ้นมาเพื่อค้นพบ "คริสตัล" หรือโครงสร้างผลึกชนิดใหม่ๆ ที่เป็นไปได้ในเชิงวัสดุศาสตร์ (material)
การมองหาคริสตัลรูปแบบใหม่ๆ เกิดขึ้นมานานแล้ว การทดลองของมนุษย์สามารถค้นพบได้ราว 20,000 รูปแบบ ภายหลังเมื่อนำเทคนิคทางคอมพิวเตอร์เข้ามาช่วย (Materials Project) สามารถค้นหาได้ 48,000 รูปแบบ แต่ AI แบบเดิมก็มีข้อจำกัดเรื่องความแม่นยำอยู่พอสมควร
AWS มีบริการ Generative AI ใต้ชื่อแบรนด์ Amazon Bedrock เริ่มมาตั้งแต่เดือนเมษายน โดยมีโมเดลให้เลือกหลากหลายยี่ห้อ เช่น Stable Diffusion, Llama 2 รวมถึงโมเดลของ AWS เองที่ชื่อตระกูล Amazon Titan
ล่าสุดในงาน re:Invent 2023 เราได้เห็นการเปิดตัวบริการใหม่ในตระกูล Titan เพิ่มเติมคือ
Ofcom หรือกสทช. ของสหราชอาณาจักร เปิดเผยผลการศึกษาเกี่ยวกับการใช้ AI สร้างเนื้อหาข้อความ รูปภาพ วิดีโอ เขียนโค้ด และอื่น ที่เรียกรวมว่า Generative AI (GenAI) โดยมีผู้ให้บริการรายสำคัญเช่น ChatGPT, Midjourney, Bing Chat, DALL-E หรือ Snapchat My AI พบประเด็นน่าสนใจดังนี้
เด็กวัยรุ่น (อายุ 13-17 ปี) ถึง 79% บอกว่าตอนนี้ใช้เครื่องมือ GenAI อยู่ เมื่อสำรวจกลุ่มที่อายุน้อยกว่า (7-12 ปี) ตัวเลขก็สูงเช่นกันคือ 40%
เมื่อมาดูกลุ่มที่อายุมากขึ้น พบว่าคนที่อายุ 16 ปี ขึ้นไปในค่าเฉลี่ยรวม มีคนที่บอกเคยใช้งาน GenAI อยู่ 31% ขณะที่ 69% บอกว่าไม่เคยใช้งาน มากกว่านั้น 24% บอกว่าไม่รู้จักเลยด้วยว่า GenAI คืออะไร
AWS เปิดบริการ Amazon Q แชตบอตผู้ช่วยสารพัดประโยชน์แบบเดียวกับ ChatGPT แต่ชูจุดเด่นในการอ่านข้อมูลภายในองค์กร สามารถดึงข้อมูลจากในสตอเรจ S3 หรือบริการอื่นๆ เช่น Salesforce, Google Drive, Microsoft 365, ServiceNow, Atlassian, หรือ Zendesk มาตอบคำถามผู้ใช้ได้
ข้อมูลที่ Amazon Q นำมาตอบนั้นจะใช้สิทธิการเข้าถึงเดียวกับสิทธิ์ของบริการที่ไปเชื่อมต่อ และสามารถสั่งงานแอปพลิเคชั่นต่างๆ เช่น เปิด ticket ใน Jira หรือเปิดเคสใน Salesforce ได้จากแอปแชต
Keras ออกเวอร์ชั่น 3.0 ตัวยจริง โดยสามารถใช้งานร่วมกับเฟรมเวิร์คเบื้องหลังได้ทั้ง TensorFlow, PyTorch, และ JAX ตามแนวทาง Keras Core ที่เปิดตัวเมื่อกลางปีที่ผ่านมา
แนวทางการเปลี่ยนเฟรมเวิร์คเบื้องหลังทำให้การพัฒนาได้ประสิทธิภาพสูงสุดเสมอ เช่น JAX นั้นประสิทธิภาพดีมากในโมเดลหลายกลุ่ม ขณะที่โมเดลบางกลุ่มกลับรันกับ TensorFlow ได้ดีกว่า โดยโมเดลที่เซฟลงไฟล์ .keras สามารถรันกับเฟรมเวิร์คเบื้องหลังตัวไหนก็ได้
โค้ดส่วนมากยังใกล้เคียงกับ Keras 2 แต่มีส่วนที่ไม่เข้ากันจำนวนหนึ่ง ควรอ่านเอกสารก่อนย้ายโค้ด
ที่มา - Keras
AWS เพิ่มฟีเจอร์ของบริการ CodeWhisperer ปัญญาประดิษฐ์ช่วยเขียนโค้ดที่เปิดตัวมาเมื่อปีที่แล้ว โดยเพิ่มฟีเจอร์สำคัญสองอย่าง คือ การแนะนำการแก้ไขช่องโหว่ความปลอดภัย, และการเขียนโค้ดในกลุ่ม Infrastructure as Code (IaC)
การแนะนำการแก้ไขช่องโหว่ความปลอดภัยนั้นอาศัย generative AI มาประกอบกับฟีเจอร์สแกนความปลอดภัยโค้ดเดิมอยู่แล้ว ฟีเจอร์นี้จะแนะนำทางแก้ไขช่องโหว่ให้ในตัว ตอนนี้รองรับภาษา Java, Python, และ TypeScript
IaC รองรับการช่วยเขียนโค้ดทั้ง CloudFormation, AWS CDK, และ Terraform ผู้ใช้สามารถสั่งจากคำสั่งกว้างๆ เช่นขอ subnet แบบ public IP
Naruto X Boruto: Ultimate Ninja Storm Connections เกมจากการ์ตูนชื่อดังที่เพิ่งวางขายไปเมื่อวันที่ 16 พฤศจิกายนที่ผ่านมา ได้ผลตอบรับในระดับกลาง ๆ จุดที่เกมเมอร์สังเกตคือเสียงพากย์ภาษาอังกฤษในเกมดูแปลกประหลาดหลายฉาก
XTX Markets บริษัทเทรดหุ้นประกาศตั้งกองทุนรางวัล Artificial Intelligence Mathematical Olympiad Prize (AI-MO Prize) มอบเงิน 10 ล้านดอลลาร์ให้กับผู้ที่สร้างปัญญาประดิษฐ์ที่ชิงเหรียญทองโอลิมปิกวิชาการสาขาคณิตศาสตร์ได้สำเร็จ
ปัญญาประดิษฐ์ที่จะได้รางวัลต้องรับโจทย์รูปแบบเดียวกับผู้เข้าแข่งขันปกติ และส่งคำตอบเป็นข้อความที่อ่านโดยกรรมการตรวจข้อสอบตามเกณฑ์คณิตศาสตร์โอลิมปิกตามปกติ
รางวัล AI-MO ไม่ได้เป็นส่วนหนึ่งของคณิตศาสตร์โอลิมปิกโดยตรง แต่จะร่วมมือกับผู้จัดการแข่งขันแต่ละรอบ โดยการแข่งครั้งแรกที่จะชิงรางวัลนี้คือการแข่งที่เมือง Bath ในอังกฤษ กลางปี 2024 นี้
ที่มา - AI-MO Prize
จากที่สหรัฐฯ มีคำสั่งแบนการส่งออกชิป AI ไปขายในจีน และ NVIDIA เลื่อนเปิดตัวชิป AI ที่ผลิตเพื่อขายที่จีน ล่าสุดพบว่าตลาดจีนปรับตัวด้วยการนำการ์ดจอ NVIDIA RTX 4090 มาดัดแปลงเป็นการ์ดฝึก AI แถมขายราคาแพงกว่าปกติ
ผู้ใช้รายหนึ่งจากฟอรัมของเว็บไซต์ Tieba Baidu ไปเยี่ยมชมโรงงานในจีนที่เชี่ยวชาญด้านรีไซเคิลการ์ดจอ แล้วพบว่ามีการแยกชิปAD102 และโมดูลหน่วยความจำ GDDR6X ออกมาจากการ์ด RTX 4090 ไปวางบน PCB แบบพิเศษ พร้อมด้วยพัดลมทำความเย็นแบบโบลเวอร์
Sony Electronics ร่วมมือกับสำนักข่าว Associated Press (AP) และ Camera Bits ผู้ให้บริการ Photo Mechanic แอปแท็กและตรวจสอบข้อมูล metadata ของภาพ ประกาศความสำเร็จในการทดสอบซอฟต์แวร์ตรวจสอบความถูกต้องของภาพถ่าย เพื่อป้องกันการใช้ Generative AI ปรับแต่งภาพ
ภาพถ่ายที่ถูกถ่ายผ่านกล้อง Sony จะถูกสแตมป์ด้วยลายเซ็นดิจิทัล (machine-based digital signature) ใน metadata ตั้งแต่ถ่ายภาพ เพื่อง่ายต่อการยืนยันว่าภาพดังกล่าวไม่ได้ถูกปรับแต่งใดๆ จาก AI โดยเป้าหมายเบื้องต้นเอาไว้สำหรับนักข่าว ที่ต้องการเพิ่มความน่าเชื่อถือของงานว่าถ่ายจากเหตุการณ์จริง ไม่มี AI เข้ามาเกี่ยวข้อง
เราเคยเห็นข่าวอินฟลูเอนเซอร์ที่สร้างจาก AI มาเรื่อย ๆ คราวนี้เป็นเรื่องราวของ Aitana Lopez อินฟลูเอนเซอร์อายุ 25 ปี ผมสีชมพู จากเมืองบาร์เซโลนา ประเทศสเปน บัญชี Instagram @fit_aitana มีผู้ติดตามมากกว่า 1.2 แสนคน และแน่นอนว่านี่เป็นอินฟลูเอนเซอร์ที่ไม่มีตัวตนจริง สร้างขึ้นจาก AI
FIA ผู้จัดการแข่งขันรถ F1 เปิดเผยว่าจะทดสอบการนำ AI มาช่วยในการตัดสิน Track Limit หรือปัญหารถขับออกนอกเส้นแทร็กสนาม โดยจะนำมาใช้ในการแข่งขันรายการอาบูดาบี กรังด์ปรีซ์ ซึ่งเป็นสนามสุดท้ายของฤดูกาลที่จะแข่งในสุดสัปดาห์นี้
เทคโนโลยีที่นำมาใช้คือ Computer Vision ทำงานร่วมกับ AI พิจารณาว่ารถแข่งขันออกนอกเส้นแทร็กสนามหรือไม่ที่ระดับพิกเซล เมื่อตรวจพบรถที่ขับออกนอกแทร็กทั้ง 4 ล้อ ระบบจะส่งรายงานให้ Steward หรือกรรมการดูแลการแข่งขันพิจารณาความผิดอีกครั้ง
เรื่องราวความชุลมุนใน OpenAI ในช่วงเกือบหนึ่งสัปดาห์ที่ผ่านมา ยังมีประเด็นเพิ่มเติม โดยสำนักข่าว Reuters รายงานว่า ก่อนที่บอร์ดจะตัดสินใจไล่ Sam Altman ออกจากซีอีโอนั้น ไม่กี่วันก่อนหน้า ฝ่ายวิจัยของ OpenAI ได้ทำรายงานแจ้งต่อบอร์ดถึงความคืบหน้าการค้นพบ AI โมเดลใหม่ ซึ่งอาจเป็นสาเหตุให้บอร์ดตัดสินใจไล่ Sam ออก
เนื่องจากภารกิจหลักของบอร์ด OpenAI คือการกำกับดูแลและติดตามการพัฒนา AI ที่ทำงานได้ครอบจักรวาล (Artificial General Intelligence - AGI) รายงานจากฝ่ายวิจัยนี้พูดถึงโครงการชื่อ Q* (อ่านว่า Q-Star) ซึ่งเป็นความก้าวหน้าของ AGI ที่ทำงานได้มากขึ้น และสามารถทดแทนงานของมนุษย์ได้มากขึ้น
Inflection AI สตาร์ตอัพของ Reid Hoffman ผู้ร่วมก่อตั้ง LinkedIn และ Mustafa Suleyman ผู้ร่วมก่อตั้ง DeepMind เปิดตัวโมเดลภาษาตัวใหม่ Inflection-2 ที่อัพเกรดขึ้นจาก Inflection-1 เวอร์ชันเมื่อเดือนพฤษภาคม
Inflection-2 ถูกเทรนด้วยจีพียู NVIDIA H100 จำนวน 5,000 ตัว ใช้กำลังประมวลผลราว 10²⁵ FLOPs ใกล้เคียงกับโมเดล PaLM 2 ของกูเกิล แต่ Inflection โฆษณาว่าผลการทดสอบกับเบนช์มาร์คปัญญาประดิษฐ์หลายๆ ตัวสามารถเอาชนะ PaLM 2 ได้ ตอนนี้คะแนนของ Inflection-2 เป็นรองแค่ GPT-4 เท่านั้น
กูเกิลอัพเดตความสามารถเพิ่มเติมของ Bard แชตบอท โดยสามารถทำความเข้าใจวิดีโอบน YouTube เพื่อตอบคำถามในรายละเอียดที่ต้องการได้ ตัวอย่าง เมื่อดูวิดีโอการทำขนม ก็สามารถถามรายละเอียดสูตรว่าใช้ไข่กี่ฟองได้ เป็นต้น
Bard รองรับการดึงข้อมูลจาก YouTube ผ่านบริการส่วนขยายมาตั้งแต่เดือนกันยายน ซึ่งตอนนั้นเน้นไปที่การแนะนำวิดีโอจากคำถาม ส่วนอัพเดตนี้เป็นการตอบคำถามจากเนื้อหาในวิดีโอ ที่น่าจะต่อเนื่องจากฟีเจอร์สรุปคลิปที่ YouTube ประกาศไปเมื่อต้นเดือน
ที่มา: TechCrunch
Stability AI เปิดตัว Stable Video Diffusion โมเดล AI สำหรับสร้างวิดีโอที่อิงพื้นฐานจากโมเดลสร้างรูปภาพ Stable Diffusion ที่สร้างรูปภาพขึ้นจากตัวหนังสือ โดยสถานะตอนนี้เป็นพรีวิวงานวิจัย ทำให้ผู้นำไปใช้งานต่อต้องยอมรับเงื่อนไขก่อน
Stable Video Diffusion ตอนนี้มี 2 โมเดลย่อย สำหรับการสร้างวิดีโอขึ้นจากรูปภาพ (image-to-video) คือ SVD สร้างวิดีโอที่ 14 เฟรม และ SVD-XT ที่ 25 เฟรม สามารถปรับแต่งเฟรมเรตได้ที่ 3-30 เฟรมต่อวินาที
ดูตัวอย่างวิดีโอที่สร้างขึ้นด้วย Stable Video Diffusion ได้ท้ายข่าว
ที่มา: Stability AI
ระหว่างที่มหากาพย์ OpenAI ยังไม่จบลง ฝั่งคู่แข่ง Anthropic (ที่มีข่าวว่ามีข้อเสนอให้ควบรวมกัน) ก็เดินหน้าออกโมเดลเวอร์ชันใหม่ Claude 2.1
จุดเด่นของ Claude 2.1 คือการรองรับอินพุตความยาว 200,000 token หรือตีเป็นคำได้ 150,000 คำ เทียบได้กับหนังสือราว 500 หน้า การรองรับอินพุตที่ยาวขนาดนี้ทำให้ Claude สามารถอ่านเอกสารการเงินขนาดยาว, วรรณกรรมขนาดยาว หรืออ่านโค้ดทั้งหมดขององค์กรได้จบทีเดียว แล้วนำไปสรุป วิเคราะห์ ตอบคำถาม ฯลฯ ตามโจทย์ของแต่ละองค์กรได้สบายๆ (ตัวอย่างของ Anthropic คือเอาเอกสารงบประมาณของรัฐสภาสหรัฐ ย้อนหลัง 3 ปีใส่เข้าไปใน Claude แล้วให้สรุปแนวโน้มงบประมาณ)
รายงานนี้มาจาก Business Insider ซึ่งได้พูดคุยกับสตาร์ทอัพหลายแห่ง บอกว่าสถานการณ์ความไม่แน่นอนภายใน OpenAI ที่ตอนนี้ยังไม่มีข้อสรุปชัดเจน แต่ในฐานะที่สตาร์ทอัพหลายแห่งเป็นลูกค้า ใช้งานเครื่องมือ AI ต่าง ๆ ของ OpenAI ในการพัฒนาบริการและแอป ก็ทำให้พวกเขาต้องพิจารณาแผนสำรอง
โดยแผนสำรองที่ว่าคือการย้ายไปใช้โมเดล AI ของค่ายอื่นทั้ง Llama 2 ของ Meta หรือ Claude ของ Anthropic ตลอดจนพิจารณาย้ายคลาวด์สำหรับประมวลผลจาก Azure ไปเป็น Google Cloud หรือ AWS
Black Jack หนึ่งในมังงะที่โด่งดังของ Tezuka Osamu นักวาดมังงะในตำนานซึ่งเสียชีวิตไปแล้วเมื่อปี 1989 ได้ออกตอนใหม่ที่ใช้ AI ช่วยสร้างขึ้นมา เพื่อฉลองครบรอบ 50 ปีของมังงะ (เขียนตั้งแต่ 1973 ถึง 1983)
Makoto Tezuka ลูกชายของศิลปินผู้ล่วงลับและผู้กำกับของ Tezuka Productions Co หนึ่งในผู้จัดงานโปรเจ็กต์นี้ กล่าวว่ารู้สึกยินดีที่มีผลงานสร้างสรรค์ที่คล้ายกับ Tezuka Osamu ถูกสร้างขึ้น โดย Black Jack ตอนใหม่นี้ใช้ธีมความศักดิ์สิทธิ์ของการมีชีวิต และหยิบยกประเด็นปัญหาที่เกิดจากเทคโนโลยีการแพทย์ขั้นสูงในสังคมสมัยใหม่ มาใช้เป็นองค์ประกอบหลักในการสร้าง