Tags:
Node Thumbnail

หลังจากที่ AI สร้างภาพจากข้อความอย่าง Midjourney กำลังเป็นที่นิยม TikTok ก็ขอเกาะกระแสด้วยการเพิ่มฟิลเตอร์สร้างรูปภาพอัตโนมัติด้วยการพิมพ์ข้อความที่ใช้ชื่อว่า “Al greenscreen” เพื่อใช้เป็นพื้นหลังสำหรับวิดีโอเป็นหลัก อย่างไรก็ตาม รูปภาพที่สร้างด้วยระบบ AI จะไม่ใช่ภาพที่มีความสมจริงแต่เป็นภาพที่ดูเป็นนามธรรมและเห็นเป็นรูปร่างคร่าว ๆ เท่านั้นไม่เหมือนการสร้างภาพด้วย AI อื่นๆ อย่าง DALL-E ของ Open AI หรือ Midjourney

Tags:
Node Thumbnail

กูเกิลมีปัญญาประดิษฐ์ชื่อ Multitask Unified Model (MUM) มาตั้งแต่ปี 2021 (เป็นคนละตัวกับ LaMDA ที่เคยเป็นข่าวว่ามีอารมณ์ความรู้สึกของตัวเอง)

MUM ถูกใช้ทำความเข้าใจความหมายของข้อมูล (understanding information) ที่ซับซ้อนกว่าตัวเลขอย่างเดียว เช่น MUM สามารถอ่านข้อมูลเกี่ยวกับการเดินเขาที่มีตัวเลขสถิติความสูง ความชันของเส้นทาง อุณหภูมิ สภาพอากาศ ฤดูกาล และให้คำแนะนำว่าควรเตรียมตัวเดินเขาลูกนั้นอย่างไร เช่น ชุดที่เหมาะสม เส้นทางที่น่าเดิน ช่วงเวลาที่ควรเดิน

Tags:
Node Thumbnail

ศาลอุทธรณ์ว่าด้วยทรัพย์สินทางปัญญา (Federal Circuit Court) เพิ่งมีคำพิพากษาออกมาว่าสิ่งประดิษฐ์หรือนวัตกรรมที่เกิดจากการคิดค้นของ AI ไม่สามารถนำไปจดสิทธิบัตรได้ เพราะตามกฎหมายสิทธิบัตร (Patent Act) ระบุไว้ชัดเจนว่า “มนุษย์” ต้องเป็นผู้คิดค้นเท่านั้น

เรื่องนี้เกิดจากการที่นาย Stephen Thaler นำรูปที่ AI ที่ชื่อว่า Creativity Machine วาดขึ้นไปจดสิทธิบัตรกับกรมทรัพย์สินทางปัญญาเมื่อปี 2019 และถูกปฏิเสธ รวมถึงนวัตกรรมจากฝีมือ AI ของ Thaler อีกตัวที่ชื่อว่า DABUS ก็ไม่สามารถจดสิทธิบัตรได้เมื่อปี 2020

กรณีแบบนี้เกิดขึ้นคล้ายกันในยุโรป จากคำตัดสินของสำนักงานจดสิทธิบัตรของ EU และศาลสูงของออสเตรเลีย ที่ไม่อนุญาตให้ผลงานของ AI สามารถใช้จดสิทธิบัตรได้

Tags:
Node Thumbnail

State Grid Xinjiang Electric Power Company หน่วยงานการไฟฟ้าที่รับผิดชอบระบบจ่ายไฟในเขต Xinjiang ได้นำเอาเทคโนโลยีปัญญาประดิษฐ์มาช่วยในการจ่ายไฟคืนให้แก่ระบบเมื่อเกิดปัญหาไฟฟ้าดับ ช่วยลดเวลาการทำงานจากหลายชั่วโมงลงเหลือเพียงแค่ 3 วินาที

ทางบริษัทการไฟฟ้าของ Xinjiang ได้นำเอาปัญญาประดิษฐ์มาใช้งานในระบบการจ่ายไฟให้แก่ย่าน Qitailu ซึ่งเป็นย่านที่พักอาศัยของผู้คนราว 200 หลังคาเรือน ตั้งอยู่ในเมือง Urumqi ของมณฑล Xinjiang โดยก่อนหน้านี้ได้มีการทดลองใช้งานมาแล้ว 1 เดือน

Tags:
Node Thumbnail

DeepMind ใช้ปัญญาประดิษฐ์ AlphaFold ทำนายโครงสร้างสามมิติของโปรตีนรวมกว่า 200 ล้านชนิด แล้วเปิดเป็นฐานข้อมูลให้ใช้งานได้ฟรี นับเป็นฐานข้อมูลโครงสร้างโปรตีนที่ใหญ่ที่สุดในตอนนี้ ครอบคลุมโปรตีนแทบทุกชนิดที่รู้จักกัน

Tags:
Node Thumbnail

เดือนที่แล้วมีข่าวใหญ่เรื่องพนักงานกูเกิลคนหนึ่ง Blake Lemoine พบว่าโปรเจค AI LaMDA พัฒนาจนมี "ความรู้สึก" (sentience) ของตัวเอง เขาถึงขั้นให้สัมภาษณ์ว่าเขาเชื่อว่า LaMDA เป็นบุคคลจริงๆ ("I legitimately believe that LaMDA is a person.")

การให้ข่าวของ Lemoine อาจผิดกระบวนการไปหน่อยเพราะไม่ได้ขออนุญาตต้นสังกัดก่อน และเป็นข่าวที่สร้างความแตกตื่นไปทั่วโลก จนกูเกิลต้องออกมาแก้ข่าวในภายหลัง

Tags:
Node Thumbnail

OpenAI ประกาศปรับสถานะบริการ DALL·E ปัญญาประดิษฐ์สร้างภาพตามคำบรรยายเข้าสู่สถานะเบต้า พร้อมใช้งานจริงยิ่งขึ้น โดยความเปลี่ยนแปลงหลักๆ เทียบกับตอนนี้คือ กระบวนการสมัครขอใช้งานจะง่ายขึ้น, ผู้ใช้สามารถนำภาพไปใช้งานเชิงการค้าได้, และมีขายเครดิตเพิ่มเติม

Tags:
Node Thumbnail

หลังจากที่ Salvatore Sanfilippo (@antirez) ผู้สร้าง Redis ได้ประกาศลาออกจากการเป็นผู้ดูแลเมื่อปี 2020 และจากที่ได้ประกาศว่าเค้าได้เริ่มเขียนนิยาย Sci-Fi หลังจากหยุดเขียนโปรแกรม ในที่สุดผลงานนิยายเรื่องแรกของเค้าก็ได้รับการวางขายบน Amazon แล้ว ต้นฉบับที่วางขายตอนนี้มีเพียงภาษาอิตาลี โดยฉบับภาษาอังกฤษกำลังอยู่ระหว่างการแปลและคาดว่าจะเสร็จในช่วงเดือนกันยายนที่จะถึง

Tags:
Node Thumbnail

AI สำหรับสร้างรูปภาพจากคำบรรยาย กำลังเป็นหัวข้อวิจัยที่มาแรง ซึ่งเห็นได้จากทั้ง DALL·E ของ OpenAI หรือ Imagen ของกูเกิล ที่สามารถสร้างสรรค์รูปภาพได้หลากหลายแบบ คราวนี้ก็เป็น Meta ที่เปิดตัวเครื่องมือแบบนี้บ้าง

งานวิจัยนี้ของ Meta มีชื่อเรียกว่า Make-A-Scene ใช้อินพุตที่เป็นข้อความบรรยายรายละเอียดรูปภาพ แต่เพิ่มเติมคือสามารถรับอินพุตที่เป็นภาพร่างเบื้องต้นได้ด้วยคู่กัน ซึ่งช่วยแก้ปัญหาการได้ผลลัพธ์รูปภาพไม่ตรงกับที่คิดในหัว

Tags:
Node Thumbnail

Andrej Karpathy หัวหน้าฝ่าย AI และ Computer Vision ของ Tesla ประกาศลาออกจากบริษัทหลังทำงานมา 5 ปี โดยระบุว่ายังไม่มีแผนแน่ชัดว่าจะทำอะไรต่อ เบื้องต้นจะใช้เวลากลับไปค้นคว้างานด้านเทคนิคเรื่อง AI, โอเพนซอร์ส และการศึกษาก่อน

Karpathy ถือเป็นหัวหน้าทีม Autopilot Vision ที่ใช้กล้องของรถยนต์ช่วยในการขับขี่อัตโนมัติ และเป็นหนึ่งในผู้บริหารไม่กี่คนที่ได้ขึ้นเวทีพูดต่อสาธารณะอยู่บ่อยครั้ง ทวีตลาออกของเขายังมี Elon Musk มาตอบว่าขอบคุณที่อยู่ช่วยงาน Tesla มายาวนานด้วย

Tags:
Node Thumbnail

Meta เปิดตัวโครงการ AI ใหม่แนวสารานุกรมออนไลน์ชื่อ Sphere

แนวทางการทำงานของ Sphere คือการให้ AI อ่านเอกสารความรู้เชิงวิชาการจำนวนมาก 134 ล้านหน้าบนอินเทอร์เน็ต นำมาย่อยเป็นข้อความ 906 ล้านย่อหน้า (เรียกว่า knowledge-intensive natural language processing หรือ KI-NLP) เพื่อให้ AI ทำตัวเป็น "ปราชญ์" สามารถตอบคำถามแนวความรู้ เช่น "ใครเป็นคนที่ได้รางวัลโนเบลสาขาฟิสิกส์คนแรกของโลก" ได้อย่างแม่นยำ

Meta บอกว่าแนวทางของ Sphere เป็นการเข้าไปอ่านเอกสารที่สแกนหาเองโดยตรง (Meta เขียน crawler เอง เพื่อมาอ่านให้เข้าใจด้วย NLP) ต่างจากแนวทางเดิมที่ใช้วิธีดึงข้อมูลจาก search engine ที่ผ่านการคัดกรองอันดับมาแล้ว

Tags:
Node Thumbnail

กูเกิลนำเสนอปัญญาประดิษฐ์ MLGO นำมาช่วยคอมไพลเลอร์ให้ออปติไมซ์โค้ดได้ดีขึ้นกว่าเดิม ทั้งในแง่ประสิทธิภาพการทำงาน และขนาดโค้ดที่ได้หลังจากคอมไพล์แล้ว

การปรับปรุงขนาดโค้ดนั้นอาศัยการย้ายโค้ดจากในฟังก์ชั่นออกมาภายนอก (inlining) ที่ก่อนหน้านี้คอมไพล์เลอร์ก็มีตัวออปติไมซ์แบบ heuristic ที่ค้นหาแนวทางการทำ inlining ให้ได้โค้ดขนาดเล็กที่สุดอยู่แล้ว แต่กระบวนการออปติไมซ์นั้นซับซ้อนและปรับปรุงเพิ่มเติมได้ยาก การใช้ MLGO เข้าไปช่วยออปติไมซ์เป็นการฝึกปัญญาประดิษฐ์แบบ reinforce learning (RL) ที่ปัญญาประดิษฐ์จะได้รางวัลจากตัดสินใจทำ inlining แล้วโค้ดเล็กลง ผที่ได้จากการคอมไพล์โค้ดภายในของกูเกิลเองสามารถลดขนาดโค้ดได้ 3-7%

Tags:
Node Thumbnail

Meta ประกาศโอเพนซอร์สโมเดล AI ที่สามารถแปลภาษาได้มากกว่า 200 ภาษา โดยโมเดลนี้ชื่อว่า No Language Left Behind ชื่อย่อ NLLB-200 ช่วยในการเข้าถึงข้อมูลในภาษาที่มีคอนเทนต์จำนวนมาก เช่น อังกฤษ จีน สเปน และอาหรับ สำหรับผู้ใช้งานในแอฟริกาและเอเชีย ที่ไม่ได้ใช้ภาษาดังกล่าว ซึ่งมีอยู่หลายร้อยล้านคน

โมเดล NLLB-200 ระบุว่ามีคุณภาพการแปลที่ดีขึ้น 44% โดยเฉลี่ย เมื่อเทียบกับงานวิจัยก่อนหน้านี้ของ Meta และได้ผลลัพธ์ที่ดีขึ้นถึง 70% สำหรับภาษาในพื้นที่แอฟริกาและอินเดีย โดยกระบวนการตรวจสอบคุณภาพการแปลนั้น ใช้ทั้งระบบและคนในการตรวจ

Tags:
Node Thumbnail

กูเกิลโชว์ผลการพัฒนา Minerva ปัญญาประดิษฐ์ด้านภาษาที่สามารถแสดงวิธีทำจากโจทย์ที่ใส่เป็นอินพุต โดยสามารถแสดงวิธีทำในปัญหาคณิตศาสตร์ทั้งการคำนวณและการอธิบายวิธีทำไปได้พร้อมกัน เหมือนนักเรียนแสดงวิธีทำจริงๆ

Minerva เป็นอาศัยโมเดลปัญญาประดิษฐ์ถามตอบ PaLM ที่กูเกิลพัฒนามาก่อนหน้านี้ แล้วฝึกเพิ่มเติมด้วยชุดข้อมูลรายงานวิจัยจาก arXiv และเว็บต่างๆ ที่มีสมการคณิตศาสตร์ รวมชุดข้อมูล 118GB เมื่อ Minerva ได้รับโจทย์มันจะสร้างคำตอบจำนวนมาก จากนั้นจึงเลือกคำตอบที่พบบ่อยที่สุด

Tags:
Node Thumbnail

การวัดประสิทธิภาพการฝึกโมเดลปัญญาประดิษฐ์ MLPerf ประกาศผลรอบใหม่ ทำให้ผู้ผลิตรายหลักๆ ก็ออกมาเคลมชัยชนะในมุมของตัวเองกัน

Google Cloud นั้นส่งผลทดสอบของ TPU v4 เข้าร่วม และโชว์ว่าแรงกว่าเซิร์ฟเวอร์ "ที่หาซื้อได้" (available on-prem) อย่างชัดเจน โดยเครื่องที่ Google Cloud ส่งผลทดสอบนั้นสามารถเปิดใช้งานได้จริงผ่านบริการ ML hub

Tags:
Node Thumbnail

Instagram ประกาศเพิ่มวิธีการตรวจสอบอายุของผู้ใช้งาน เริ่มมีผลกับผู้ใช้ในอเมริกาที่พยายามแก้ไขอายุให้เกิน 18 ปี จากเดิมที่ผู้ใช้งานต้องแสดงบัตรประจำตัว (ID Card) โดยเพิ่มวิธีการยืนยันผ่านเพื่อน และอีกวิธีซึ่งมีรายละเอียดน่าสนใจคือ ส่งวิดีโอเซลฟี่แล้วใช้ AI ตรวจสอบอายุจากใบหน้า

ทั้งนี้ Instagram กำหนดให้ผู้ใช้งานต้องมีอายุอย่างน้อย 13 ปี โดยมีส่วนที่แตกต่างสำหรับผู้ใช้งานช่วง 13-17 ปี เช่น บัญชีจะตั้งค่าเป็นส่วนตัวเป็นค่าเริ่มต้น กำหนดไม่ให้คนไม่รู้จักติดต่อได้ รวมทั้งคอนเทนต์โฆษณาต่าง ๆ ก็ถูกปรับเนื้อหา

Tags:
Node Thumbnail

GitHub ประกาศเปิดบริการ Copilot อย่างเป็นทางการ หลังจากเปิดทดสอบวงปิดมาตั้งแต่ปีที่แล้ว โดยผู้ใช้สามารถทดสอบใช้งานได้ฟรี 60 วัน หลังจากนั้นค่าบริการอยู่ที่เดือนละ 10 ดอลลาร์ หรือปีละ 100 ดอลลาร์

ตอนนี้ Copilot รองรับโปรแกรมแก้ไขโค้ดยอดนิยม ได้แก่ Neovim, JetBrains, Visual Studio, และ VSCode สามารถแนะนำโค้ดในภาษาโปรแกรมได้นับสิบภาษา และช่วงทดสอบที่ผ่านมามีผู้ทดสอบถึง 1.2 ล้านคน

ทาง GitHub จะให้บริการฟรีกับนักเรียนและผู้ดูแลโครงการโอเพนซอร์สยอดนิยม ส่วนแพ็กเกจแบบเสียเงินสำหรับองค์กรจะตามมาภายหลัง

ที่มา - GitHub Blog

Tags:
Node Thumbnail

Meta บริษัทแม่ของ Facebook ประกาศปรับโครงสร้างฝ่าย AI เนื่องจาก Jerome Pesenti รองประธานฝ่าย ที่อยู่ในตำแหน่งนี้มา 4 ปี จะลาออกจากบริษัท มีผลกลางเดือนมิถุนายน ซึ่งเป็นการลาออกของผู้บริหารระดับสูงต่อจากซีโอโอ Sheryl Sandberg

การเปลี่ยนแปลงสำคัญคือฝ่าย AI ใน Meta เดิมมีใช้วิธีจัดการแบบรวมศูนย์ คือทีมใหญ่ทีมเดียวรับผิดชอบ AI ในทุกผลิตภัณฑ์และบริการตั้งแต่ Facebook, Instagram จนถึง Oculus แต่หลังการลาออกของ Jerome ทีมงานในฝ่าย AI จะกระจายไปเป็นส่วนหนึ่งของทีมต่าง ๆ ดังนี้

Tags:
Node Thumbnail

กูเกิลเปิดตัว Imagen งานวิจัย AI สร้างรูปภาพเสมือนจริงที่ใช้ input เป็นคำบรรยาย แบบเดียวกับ DALL·E ของ OpenAI โดยมีขั้นตอนการทำงานคือแปลงข้อมูล text ออกมาเป็นภาพความละเอียดต่ำ จากนั้นใช้เครื่องมือแปลงให้เป็นภาพที่มีความละเอียดมากขึ้น

จุดเด่นที่กูเกิลระบุว่า Imagen เหนือกว่าเครื่องมือประเภทเดียวกัน คือการพัฒนาเครื่องมือวัดผลที่ชื่อ DrawBench ซึ่งใช้การเทียบข้อมูล text แบบเดียวกัน สร้างรูปภาพจากเครื่องมือหรือโมเดลอื่นมาเปรียบเทียบได้แก่ VQ-GAN+CLIP, Latent Diffusion Models และ DALL-E 2 ซึ่งประเมินคุณภาพของรูปโดยใช้คนตัดสิน พบว่า Imagen มีคะแนนที่ดีกว่า

Tags:
Node Thumbnail

PyTorch เฟรมเวิร์คปัญญาประดิษฐ์ประกาศเตรียมรองรับ API กราฟิก Metal ใน macOS ทำให้สามารถเร่งความเร็วด้วย Apple Silicon ได้เต็มรูปแบบ ทำให้การรันโมเดลปัญญาประดิษฐ์ทั้งการฝึกโมเดลและการใช้งานโมเดลประสิทธิภาพดีขึ้นมาก การฝึกโมเดลเร็วขึ้น 6-8 เท่า ขณะที่การรันโมเดลประสิทธิภาพดีขึ้นกว่า 20 เท่าตัวในบางกรณี

การเร่งความเร็วใช้ Metal Performance Shaders (MPS) มาทำงานเบื้องหลัง ความได้เปรียบสำคัญของ Apple Silicon คือ unified memory ที่ใช้หน่วยความจำรวมกันทั้งกราฟิกและซีพียู ทำให้ไม่เสียเวลาโอนข้อมูลไปมา และสามารถประมวลผลชุดข้อมูลขนาดใหญ่บนวงจรกราฟิกได้

Tags:
Node Thumbnail

ในงาน Google I/O สัปดาห์ที่ผ่านมา กูเกิลเปิดตัว LaMDA 2 ปัญญาประดิษฐ์เพื่อการสนทนา (conversation AI) เวอร์ชันอัพเกรดจาก LaMDA (Language Models for Dialog Applications) รุ่นแรกที่เปิดตัวในปี 2021

กูเกิลบอกว่า LaMDA 2 มีพารามิเตอร์มากกว่า 137 พันล้านรายการ เทรนด้วยข้อมูลขนาดใหญ่ 1.56 ล้านล้านคำ ได้โมเดลที่พัฒนาขึ้นจากเดิมใน 3 ด้านคือ

Tags:
Node Thumbnail

หลายคนอาจเคยประสบปัญหาข้อความแชทเยอะเกินไปจนอ่านไม่ไหว แต่จะไม่อ่านก็ไม่ได้เพราะเป็นเรื่องงาน

กูเกิลแก้ปัญหานี้ด้วยการให้ machine learning อ่านแชททั้งหมดให้เรา และสรุปเป็น summary สั้นๆ ประมาณ 2-3 บรรทัด (TL;DR) ที่ด้านบนของข้อความแชท เพื่อให้เราอ่านก่อนเป็นไอเดียว่าคนอื่นคุยเรื่องอะไรกัน

ฟีเจอร์นี้ใช้เอนจินสรุปข้อความตัวเดียวกับ Google Docs ใช้มาก่อนหน้านี้ และจะใช้ได้กับบริการแชทองค์กร Google Chat กับ Google Spaces

Tags:
Node Thumbnail

Google Meet ประกาศฟีเจอร์ด้าน AI หลายอย่างที่ช่วยให้คุณภาพของภาพและเสียงออกมาดีกว่าเดิม แม้อยู่ในสภาพแสงน้อย หรือใช้เว็บแคมคุณภาพต่ำก็ตาม

อย่างแรกคือ Portrait Restore ปรับคุณภาพของวิดีโอให้ดีขึ้น จากตัวอย่างจะเห็นว่าผู้ประชุมนั่งแบบย้อนแสง หน้ามืด ก็กลับมาสว่างขึ้นจากเดิมมาก กระบวนการทั้งหมดเกิดขึ้นบนคลาวด์ ไม่กระทบประสิทธิภาพของอุปกรณ์ฝั่งผู้ใช้

Tags:
Node Thumbnail

Google Translate เพิ่มภาษาที่รองรับอีก 24 ภาษา โดยส่วนมากเป็นภาษาท้องถิ่นที่มีคนใช้เฉพาะในพื้นที่เท่านั้น แม้ว่าบางภาษาจะมีคนใช้งานถึง 50 ล้านคน โดยรวมแล้วภาษาอีก 24 ภาษาที่เพิ่มเข้ามา มีผู้ใช้งานรวมกว่า 300 ล้านคน ภาษาที่คนใช้งานน้อยที่สุดคือภาษาสันสกฤตที่มีคนใช้งานราว 20,000 คนเท่านั้น

ความยากของภาษาเหล่านี้คือกูเกิลไม่มีชุดข้อมูลเทียบสองภาษาให้ฝึกปัญญาประดิษฐ์ แต่มีเอกสารข้อความในภาษาเหล่านี้เดี่ยวๆ เท่านั้น (monolingual text) ทำให้ต้องใช้เทคนิค Zero-Shot Machine Translation

Tags:
Node Thumbnail

อินเทลเปิดตัวชิปฝึกโมเดลปัญญาประดิษฐ์ Habana Gaudi2 หลังจาก Gaudi รุ่นแรกชูจุดแข็งว่าต้นทุนการฝึกปัญญาประดิษฐ์ถูกกว่าคู่แข่ง ตอนนี้ Gaudi2 ปรับมาใช้เทคโนโลยีการผลิต 7nm จากเดิม 16nm แรมในตัวมากถึง 96GB และแคชแบบ SRAM 48MB

การปรับเทคโนโลยีรอบนี้ทำให้อินเทลโชว์ทรูพุตการฝึกโมเดลปัญญาประดิษฐ์สำคัญ เช่น ResNet50 สำหรับการจัดหมวดหมู่ภาพ และ BERT สำหรับการประมวลผลภาษาว่าเร็วกว่าชิป NVIDIA A100 สองเท่าตัว อย่างไรก็ดี NVIDIA A100 นั้นวางตลาดมานานแล้ว และรุ่นล่าสุดคือ H100 เพิ่งเปิดตัวไปเมื่อเดือนมีนาคม

Pages