AWS มีบริการ Generative AI ใต้ชื่อแบรนด์ Amazon Bedrock เริ่มมาตั้งแต่เดือนเมษายน โดยมีโมเดลให้เลือกหลากหลายยี่ห้อ เช่น Stable Diffusion, Llama 2 รวมถึงโมเดลของ AWS เองที่ชื่อตระกูล Amazon Titan
ล่าสุดในงาน re:Invent 2023 เราได้เห็นการเปิดตัวบริการใหม่ในตระกูล Titan เพิ่มเติมคือ
Ofcom หรือกสทช. ของสหราชอาณาจักร เปิดเผยผลการศึกษาเกี่ยวกับการใช้ AI สร้างเนื้อหาข้อความ รูปภาพ วิดีโอ เขียนโค้ด และอื่น ที่เรียกรวมว่า Generative AI (GenAI) โดยมีผู้ให้บริการรายสำคัญเช่น ChatGPT, Midjourney, Bing Chat, DALL-E หรือ Snapchat My AI พบประเด็นน่าสนใจดังนี้
เด็กวัยรุ่น (อายุ 13-17 ปี) ถึง 79% บอกว่าตอนนี้ใช้เครื่องมือ GenAI อยู่ เมื่อสำรวจกลุ่มที่อายุน้อยกว่า (7-12 ปี) ตัวเลขก็สูงเช่นกันคือ 40%
เมื่อมาดูกลุ่มที่อายุมากขึ้น พบว่าคนที่อายุ 16 ปี ขึ้นไปในค่าเฉลี่ยรวม มีคนที่บอกเคยใช้งาน GenAI อยู่ 31% ขณะที่ 69% บอกว่าไม่เคยใช้งาน มากกว่านั้น 24% บอกว่าไม่รู้จักเลยด้วยว่า GenAI คืออะไร
AWS เปิดบริการ Amazon Q แชตบอตผู้ช่วยสารพัดประโยชน์แบบเดียวกับ ChatGPT แต่ชูจุดเด่นในการอ่านข้อมูลภายในองค์กร สามารถดึงข้อมูลจากในสตอเรจ S3 หรือบริการอื่นๆ เช่น Salesforce, Google Drive, Microsoft 365, ServiceNow, Atlassian, หรือ Zendesk มาตอบคำถามผู้ใช้ได้
ข้อมูลที่ Amazon Q นำมาตอบนั้นจะใช้สิทธิการเข้าถึงเดียวกับสิทธิ์ของบริการที่ไปเชื่อมต่อ และสามารถสั่งงานแอปพลิเคชั่นต่างๆ เช่น เปิด ticket ใน Jira หรือเปิดเคสใน Salesforce ได้จากแอปแชต
Keras ออกเวอร์ชั่น 3.0 ตัวยจริง โดยสามารถใช้งานร่วมกับเฟรมเวิร์คเบื้องหลังได้ทั้ง TensorFlow, PyTorch, และ JAX ตามแนวทาง Keras Core ที่เปิดตัวเมื่อกลางปีที่ผ่านมา
แนวทางการเปลี่ยนเฟรมเวิร์คเบื้องหลังทำให้การพัฒนาได้ประสิทธิภาพสูงสุดเสมอ เช่น JAX นั้นประสิทธิภาพดีมากในโมเดลหลายกลุ่ม ขณะที่โมเดลบางกลุ่มกลับรันกับ TensorFlow ได้ดีกว่า โดยโมเดลที่เซฟลงไฟล์ .keras สามารถรันกับเฟรมเวิร์คเบื้องหลังตัวไหนก็ได้
โค้ดส่วนมากยังใกล้เคียงกับ Keras 2 แต่มีส่วนที่ไม่เข้ากันจำนวนหนึ่ง ควรอ่านเอกสารก่อนย้ายโค้ด
ที่มา - Keras
AWS เพิ่มฟีเจอร์ของบริการ CodeWhisperer ปัญญาประดิษฐ์ช่วยเขียนโค้ดที่เปิดตัวมาเมื่อปีที่แล้ว โดยเพิ่มฟีเจอร์สำคัญสองอย่าง คือ การแนะนำการแก้ไขช่องโหว่ความปลอดภัย, และการเขียนโค้ดในกลุ่ม Infrastructure as Code (IaC)
การแนะนำการแก้ไขช่องโหว่ความปลอดภัยนั้นอาศัย generative AI มาประกอบกับฟีเจอร์สแกนความปลอดภัยโค้ดเดิมอยู่แล้ว ฟีเจอร์นี้จะแนะนำทางแก้ไขช่องโหว่ให้ในตัว ตอนนี้รองรับภาษา Java, Python, และ TypeScript
IaC รองรับการช่วยเขียนโค้ดทั้ง CloudFormation, AWS CDK, และ Terraform ผู้ใช้สามารถสั่งจากคำสั่งกว้างๆ เช่นขอ subnet แบบ public IP
Naruto X Boruto: Ultimate Ninja Storm Connections เกมจากการ์ตูนชื่อดังที่เพิ่งวางขายไปเมื่อวันที่ 16 พฤศจิกายนที่ผ่านมา ได้ผลตอบรับในระดับกลาง ๆ จุดที่เกมเมอร์สังเกตคือเสียงพากย์ภาษาอังกฤษในเกมดูแปลกประหลาดหลายฉาก
XTX Markets บริษัทเทรดหุ้นประกาศตั้งกองทุนรางวัล Artificial Intelligence Mathematical Olympiad Prize (AI-MO Prize) มอบเงิน 10 ล้านดอลลาร์ให้กับผู้ที่สร้างปัญญาประดิษฐ์ที่ชิงเหรียญทองโอลิมปิกวิชาการสาขาคณิตศาสตร์ได้สำเร็จ
ปัญญาประดิษฐ์ที่จะได้รางวัลต้องรับโจทย์รูปแบบเดียวกับผู้เข้าแข่งขันปกติ และส่งคำตอบเป็นข้อความที่อ่านโดยกรรมการตรวจข้อสอบตามเกณฑ์คณิตศาสตร์โอลิมปิกตามปกติ
รางวัล AI-MO ไม่ได้เป็นส่วนหนึ่งของคณิตศาสตร์โอลิมปิกโดยตรง แต่จะร่วมมือกับผู้จัดการแข่งขันแต่ละรอบ โดยการแข่งครั้งแรกที่จะชิงรางวัลนี้คือการแข่งที่เมือง Bath ในอังกฤษ กลางปี 2024 นี้
ที่มา - AI-MO Prize
จากที่สหรัฐฯ มีคำสั่งแบนการส่งออกชิป AI ไปขายในจีน และ NVIDIA เลื่อนเปิดตัวชิป AI ที่ผลิตเพื่อขายที่จีน ล่าสุดพบว่าตลาดจีนปรับตัวด้วยการนำการ์ดจอ NVIDIA RTX 4090 มาดัดแปลงเป็นการ์ดฝึก AI แถมขายราคาแพงกว่าปกติ
ผู้ใช้รายหนึ่งจากฟอรัมของเว็บไซต์ Tieba Baidu ไปเยี่ยมชมโรงงานในจีนที่เชี่ยวชาญด้านรีไซเคิลการ์ดจอ แล้วพบว่ามีการแยกชิปAD102 และโมดูลหน่วยความจำ GDDR6X ออกมาจากการ์ด RTX 4090 ไปวางบน PCB แบบพิเศษ พร้อมด้วยพัดลมทำความเย็นแบบโบลเวอร์
Sony Electronics ร่วมมือกับสำนักข่าว Associated Press (AP) และ Camera Bits ผู้ให้บริการ Photo Mechanic แอปแท็กและตรวจสอบข้อมูล metadata ของภาพ ประกาศความสำเร็จในการทดสอบซอฟต์แวร์ตรวจสอบความถูกต้องของภาพถ่าย เพื่อป้องกันการใช้ Generative AI ปรับแต่งภาพ
ภาพถ่ายที่ถูกถ่ายผ่านกล้อง Sony จะถูกสแตมป์ด้วยลายเซ็นดิจิทัล (machine-based digital signature) ใน metadata ตั้งแต่ถ่ายภาพ เพื่อง่ายต่อการยืนยันว่าภาพดังกล่าวไม่ได้ถูกปรับแต่งใดๆ จาก AI โดยเป้าหมายเบื้องต้นเอาไว้สำหรับนักข่าว ที่ต้องการเพิ่มความน่าเชื่อถือของงานว่าถ่ายจากเหตุการณ์จริง ไม่มี AI เข้ามาเกี่ยวข้อง
เราเคยเห็นข่าวอินฟลูเอนเซอร์ที่สร้างจาก AI มาเรื่อย ๆ คราวนี้เป็นเรื่องราวของ Aitana Lopez อินฟลูเอนเซอร์อายุ 25 ปี ผมสีชมพู จากเมืองบาร์เซโลนา ประเทศสเปน บัญชี Instagram @fit_aitana มีผู้ติดตามมากกว่า 1.2 แสนคน และแน่นอนว่านี่เป็นอินฟลูเอนเซอร์ที่ไม่มีตัวตนจริง สร้างขึ้นจาก AI
FIA ผู้จัดการแข่งขันรถ F1 เปิดเผยว่าจะทดสอบการนำ AI มาช่วยในการตัดสิน Track Limit หรือปัญหารถขับออกนอกเส้นแทร็กสนาม โดยจะนำมาใช้ในการแข่งขันรายการอาบูดาบี กรังด์ปรีซ์ ซึ่งเป็นสนามสุดท้ายของฤดูกาลที่จะแข่งในสุดสัปดาห์นี้
เทคโนโลยีที่นำมาใช้คือ Computer Vision ทำงานร่วมกับ AI พิจารณาว่ารถแข่งขันออกนอกเส้นแทร็กสนามหรือไม่ที่ระดับพิกเซล เมื่อตรวจพบรถที่ขับออกนอกแทร็กทั้ง 4 ล้อ ระบบจะส่งรายงานให้ Steward หรือกรรมการดูแลการแข่งขันพิจารณาความผิดอีกครั้ง
เรื่องราวความชุลมุนใน OpenAI ในช่วงเกือบหนึ่งสัปดาห์ที่ผ่านมา ยังมีประเด็นเพิ่มเติม โดยสำนักข่าว Reuters รายงานว่า ก่อนที่บอร์ดจะตัดสินใจไล่ Sam Altman ออกจากซีอีโอนั้น ไม่กี่วันก่อนหน้า ฝ่ายวิจัยของ OpenAI ได้ทำรายงานแจ้งต่อบอร์ดถึงความคืบหน้าการค้นพบ AI โมเดลใหม่ ซึ่งอาจเป็นสาเหตุให้บอร์ดตัดสินใจไล่ Sam ออก
เนื่องจากภารกิจหลักของบอร์ด OpenAI คือการกำกับดูแลและติดตามการพัฒนา AI ที่ทำงานได้ครอบจักรวาล (Artificial General Intelligence - AGI) รายงานจากฝ่ายวิจัยนี้พูดถึงโครงการชื่อ Q* (อ่านว่า Q-Star) ซึ่งเป็นความก้าวหน้าของ AGI ที่ทำงานได้มากขึ้น และสามารถทดแทนงานของมนุษย์ได้มากขึ้น
Inflection AI สตาร์ตอัพของ Reid Hoffman ผู้ร่วมก่อตั้ง LinkedIn และ Mustafa Suleyman ผู้ร่วมก่อตั้ง DeepMind เปิดตัวโมเดลภาษาตัวใหม่ Inflection-2 ที่อัพเกรดขึ้นจาก Inflection-1 เวอร์ชันเมื่อเดือนพฤษภาคม
Inflection-2 ถูกเทรนด้วยจีพียู NVIDIA H100 จำนวน 5,000 ตัว ใช้กำลังประมวลผลราว 10²⁵ FLOPs ใกล้เคียงกับโมเดล PaLM 2 ของกูเกิล แต่ Inflection โฆษณาว่าผลการทดสอบกับเบนช์มาร์คปัญญาประดิษฐ์หลายๆ ตัวสามารถเอาชนะ PaLM 2 ได้ ตอนนี้คะแนนของ Inflection-2 เป็นรองแค่ GPT-4 เท่านั้น
กูเกิลอัพเดตความสามารถเพิ่มเติมของ Bard แชตบอท โดยสามารถทำความเข้าใจวิดีโอบน YouTube เพื่อตอบคำถามในรายละเอียดที่ต้องการได้ ตัวอย่าง เมื่อดูวิดีโอการทำขนม ก็สามารถถามรายละเอียดสูตรว่าใช้ไข่กี่ฟองได้ เป็นต้น
Bard รองรับการดึงข้อมูลจาก YouTube ผ่านบริการส่วนขยายมาตั้งแต่เดือนกันยายน ซึ่งตอนนั้นเน้นไปที่การแนะนำวิดีโอจากคำถาม ส่วนอัพเดตนี้เป็นการตอบคำถามจากเนื้อหาในวิดีโอ ที่น่าจะต่อเนื่องจากฟีเจอร์สรุปคลิปที่ YouTube ประกาศไปเมื่อต้นเดือน
ที่มา: TechCrunch
Stability AI เปิดตัว Stable Video Diffusion โมเดล AI สำหรับสร้างวิดีโอที่อิงพื้นฐานจากโมเดลสร้างรูปภาพ Stable Diffusion ที่สร้างรูปภาพขึ้นจากตัวหนังสือ โดยสถานะตอนนี้เป็นพรีวิวงานวิจัย ทำให้ผู้นำไปใช้งานต่อต้องยอมรับเงื่อนไขก่อน
Stable Video Diffusion ตอนนี้มี 2 โมเดลย่อย สำหรับการสร้างวิดีโอขึ้นจากรูปภาพ (image-to-video) คือ SVD สร้างวิดีโอที่ 14 เฟรม และ SVD-XT ที่ 25 เฟรม สามารถปรับแต่งเฟรมเรตได้ที่ 3-30 เฟรมต่อวินาที
ดูตัวอย่างวิดีโอที่สร้างขึ้นด้วย Stable Video Diffusion ได้ท้ายข่าว
ที่มา: Stability AI
ระหว่างที่มหากาพย์ OpenAI ยังไม่จบลง ฝั่งคู่แข่ง Anthropic (ที่มีข่าวว่ามีข้อเสนอให้ควบรวมกัน) ก็เดินหน้าออกโมเดลเวอร์ชันใหม่ Claude 2.1
จุดเด่นของ Claude 2.1 คือการรองรับอินพุตความยาว 200,000 token หรือตีเป็นคำได้ 150,000 คำ เทียบได้กับหนังสือราว 500 หน้า การรองรับอินพุตที่ยาวขนาดนี้ทำให้ Claude สามารถอ่านเอกสารการเงินขนาดยาว, วรรณกรรมขนาดยาว หรืออ่านโค้ดทั้งหมดขององค์กรได้จบทีเดียว แล้วนำไปสรุป วิเคราะห์ ตอบคำถาม ฯลฯ ตามโจทย์ของแต่ละองค์กรได้สบายๆ (ตัวอย่างของ Anthropic คือเอาเอกสารงบประมาณของรัฐสภาสหรัฐ ย้อนหลัง 3 ปีใส่เข้าไปใน Claude แล้วให้สรุปแนวโน้มงบประมาณ)
รายงานนี้มาจาก Business Insider ซึ่งได้พูดคุยกับสตาร์ทอัพหลายแห่ง บอกว่าสถานการณ์ความไม่แน่นอนภายใน OpenAI ที่ตอนนี้ยังไม่มีข้อสรุปชัดเจน แต่ในฐานะที่สตาร์ทอัพหลายแห่งเป็นลูกค้า ใช้งานเครื่องมือ AI ต่าง ๆ ของ OpenAI ในการพัฒนาบริการและแอป ก็ทำให้พวกเขาต้องพิจารณาแผนสำรอง
โดยแผนสำรองที่ว่าคือการย้ายไปใช้โมเดล AI ของค่ายอื่นทั้ง Llama 2 ของ Meta หรือ Claude ของ Anthropic ตลอดจนพิจารณาย้ายคลาวด์สำหรับประมวลผลจาก Azure ไปเป็น Google Cloud หรือ AWS
Black Jack หนึ่งในมังงะที่โด่งดังของ Tezuka Osamu นักวาดมังงะในตำนานซึ่งเสียชีวิตไปแล้วเมื่อปี 1989 ได้ออกตอนใหม่ที่ใช้ AI ช่วยสร้างขึ้นมา เพื่อฉลองครบรอบ 50 ปีของมังงะ (เขียนตั้งแต่ 1973 ถึง 1983)
Makoto Tezuka ลูกชายของศิลปินผู้ล่วงลับและผู้กำกับของ Tezuka Productions Co หนึ่งในผู้จัดงานโปรเจ็กต์นี้ กล่าวว่ารู้สึกยินดีที่มีผลงานสร้างสรรค์ที่คล้ายกับ Tezuka Osamu ถูกสร้างขึ้น โดย Black Jack ตอนใหม่นี้ใช้ธีมความศักดิ์สิทธิ์ของการมีชีวิต และหยิบยกประเด็นปัญหาที่เกิดจากเทคโนโลยีการแพทย์ขั้นสูงในสังคมสมัยใหม่ มาใช้เป็นองค์ประกอบหลักในการสร้าง
Amazon ประกาศโครงการ AI Ready เพื่อส่งเสริมการเรียนรู้ด้าน AI โดยมีเป้าหมายให้เข้าถึงคน 2 ล้านคน ภายในปี 2025 เนื่องจากมองว่าเป็นทักษะที่สำคัญในยุคถัดไป มีรายละเอียดสามอย่างดังนี้
อย่างแรกคือการเพิ่ม 8 คอร์สเรียนฟรีด้าน AI และ Generative AI ซึ่งมีทั้งด้านการประยุกต์ใช้งานทางธุรกิจ จนถึงคอร์สสำหรับงานทางเทคนิค ดูรายละเอียดเพิ่มเติมได้ที่ AWS Educate และ AWS Skill Builder ซึ่ง 8 คอร์สที่เปิดใหม่เพิ่มมีดังนี้
ในการประชุมผู้นำความร่วมมือทางเศรษฐกิจในภูมิภาคเอเชีย-แปซิฟิก (APEC) รัฐบาลไทย และ Google ประกาศความร่วมมือทางยุทธศาสตร์เพื่อเสริมการแข่งขันด้านดิจิทัลของประเทศไทย และเร่งให้เกิดนวัตกรรม AI ทั้ง 2 ฝ่ายจะทำงานร่วมกันเพื่อวางรากฐาน 4 เสาหลักที่จำเป็นต่อการส่งเสริมประเทศไทยให้เติบโตในเศรษฐกิจ AI ได้แก่
นโยบายของไมโครซอฟท์ยุคนี้คือพยายามใส่ฟีเจอร์ Copilot คุยกับ AI มาในทุกอณูของผลิตภัณฑ์ ตลอดทั้งปีนี้เราเห็นการเพิ่มฟีเจอร์ AI Chat เข้ามาในผลิตภัณฑ์ของไมโครซอฟท์จำนวนมาก
Windows Terminal เป็นแอพล่าสุดที่ได้ฟีเจอร์นี้ โดยใช้ชื่อฟีเจอร์ว่า Terminal Copilot Terminal Chat
ฟีเจอร์นี้ทำให้เรากดปุ่มลัด (ตั้งเองได้) เพื่อเรียก AI chat ขึ้นมา เบื้องหลังเป็นการคุยกับ AI โมเดล GPT-3.5 Turbo บนเซิร์ฟเวอร์ Azure OpenAI Service เพื่อช่วยตอบคำถามเกี่ยวกับวิธีการใช้งาน Terminal เช่น การเขียน shellscript แบบต่างๆ
พจนานุกรม Cambridge ประกาศคำศัพท์แห่งปี 2023 (Word of the year) คือคำว่า Hallucinate ซึ่งทางพจนานุกรมใช้นิยามของคำนี้ตามยุคสมัยของ AI
Hallucinate หากแปลตามความหมายดั้งเดิมคือ อาการเห็น ได้ยิน หรือรู้สึก ในสิ่งที่ไม่มีอยู่จริง ซึ่งอาจมาจากอาการป่วยหรือผลจากยาเสพติด ส่วนพจนานุกรมฉบับสอ เสถบุตร แปลไว้ว่า การลวงตัวเอง คลั่ง เพ้อ
Meta ยืนยันรายงานข่าวว่าบริษัทได้ยุบแผนก Responsible AI (RAI) หรือฝ่ายที่ดูแลด้านความปลอดภัยของ AI ต่าง ๆ ที่มีการใช้งานในแพลตฟอร์ม โดยพนักงานในฝ่ายนี้จะย้ายไปอยู่กับฝ่ายที่ดูแลผลิตภัณฑ์ Genarative AI หรือบางส่วนไปอยู่ส่วน Infrastructure ของ AI แทน
การยุบฝ่าย RAI นี้ เป็นไปตามแผนการปรับโครงสร้างองค์กรให้มีประสิทธิภาพสูงสุดตามแผนงานของ Meta ในปีนี้ ที่นำไปสู่การยุบแผนก หรือปลดพนักงานออกจำนวนมาก อย่างไรก็ตามตำแหน่งงานที่ดูแลความปลอดภัยของ AI ว่าสามารถทำงานได้อย่างถูกต้องเหมาะสม เป็นประเด็นสำคัญที่บริษัทเทคโนโลยีซึ่งพัฒนา AI ให้ความสำคัญ
Discord ประกาศปิดการทำงานแชตบอท AI ที่ชื่อบริการว่า Clyde มีผลตั้งแต่วันที่ 1 ธันวาคมเป็นต้น โดยจะไม่สามารถเรียกใช้งาน Clyde ได้ทั้งใน DM, DM กลุ่ม หรือแชตในเซิร์ฟเวอร์
แชตบอท Clyde เริ่มเปิดทดสอบใช้งานตั้งแต่ต้นปีที่ผ่านมา โดยใช้เทคโนโลยีจาก OpenAI ในการตอบคำถามและสร้างบทสนทนากับผู้ใช้งาน แบบจำกัดความสามารถ
อย่างไรก็ตาม Discord ไม่ได้บอกว่า Clyde จะปิดให้บริการไปถาวรเลยหรือไม่ หรืออาจเพิ่มเป็นฟีเจอร์จ่ายเงินสำหรับลูกค้า Nitro ในอนาคต ก็ต้องดูกันต่อไป
ที่มา: The Verge
Meta โชว์งานวิจัยปัญญาประดิษฐ์ 2 ตัวสำคัญ คือ Emu Edit สำหรับการแก้ไขภาพตามคำสั่ง และ Emu Video ที่แปลงภาพนิ่งกลายเป็นภาพเคลื่อนไหวโดยทั้งสองโมเดลอาศัยโมเดลแปลงข้อความเป็นภาพที่ชื่อว่า Emu ที่ Meta เคยรายงานมาก่อนหน้านี้แล้ว
Emu Video สามารถสร้างภาพเคลื่อนไหวได้จากข้อความอย่างเดียว, ภาพอย่างเดียว, หรือสองอย่างร่วมกันก็ได้ โดยภายในโครงสร้างเรียบง่ายกว่าโมเดลเดิม เช่น Make-A-Video ทำให้ทำงานได้เร็วกว่ามาก ขณะที่ผลทดสอบด้วยคนให้เลือกวิดีโอที่สวยกว่า Emu Video ก็ถูกเลือกมากกว่าทุกโมเดล โดยเฉลี่ยสูงถึง 96% มีเพียง Imagen-Video ที่ได้คะแนนความถูกต้อง (faithfulness) พอๆ กับ Emu Video