ทุกวันนี้ระบบปัญญาประดิษฐ์สำหรับประมวลผลภาษา (natural language processing - NLP) ตัวที่ดีที่สุดคือ BERT เสนอโดยกูเกิลเมื่อปลายปี 2018 แม้ประสิทธิภาพจะค่อนข้างดีจนกูเกิลนำมาใช้ในบริการค้นหาแล้ว แต่ปัญหาของ BERT คือมีขนาดใหญ่มาก โมเดลเริ่มต้นมีขนาด 108 ล้านพารามิเตอร์และขนาด xlarge นั้นขึ้นไปถึง 1,270 ล้านพารามิเตอร์ ปีนี้ทีมวิจัยกูเกิลเสนอโมเดล ALBERT ที่เป็นโมเดลขนาดเล็กลง แต่ยังคงประสิทธิภาพที่ใกล้เคียงกัน โดยเฉพาะ ALBERT ในขนาดใหญ่สุด 235 ล้านพารามิเตอร์นั้นประสิทธิภาพดีกว่า BERT ในทุกการทดสอบ
เป็นข่าวมาเนิ่นนานแล้วว่า YouTube จะฉายสารคดี AI เป็นคอนเทนต์ออริจินัล และมีผู้ดำเนินรายการคือ Robert Downey Jr.หรือผู้รับบทฮีโร่ผู้เชี่ยวชาญด้าน AI และการสร้างหุ่นยนต์ในเรื่อง Iron Man นั่นเอง
ล่าสุด YouTube ฉายสารคดีแล้วโดยใช้ชื่อว่า The Age of A.I. เป็นสารคดี 8 ตอน ตัวสารคดีจะพูดถึงนิยาม ความสามารถและพยายามจะทำให้ AI ไม่ดูเป็นเรื่องลึกลับ รวมถึงความก้าวหน้าล่าสุดที่ AI สามารถทำได้ในตอนนี้ และไม่ต้องเป็นผู้ใช้งาน YouTube Premium ก็สามารถดูสารคดีนี้ได้ผ่าน YouTube ตามปกติ แต่ไม่มีคำบรรยายภาษาไทยให้
กูเกิลเขียนบล็อกอธิบายถึงเทคนิคในแอปกล้องโหมด Portrait ที่ทำหน้าชัดหลังเบลอ โดยตั้งแต่ Pixel 2 นั้นอาศัยข้อมูลการโฟกัสแบบ dual-pixel มาประมาณค่าความลึกในส่วนต่างๆ ของภาพ แต่ใน Pixel 4 เนื่องจากมีกล้องหลายตัวแล้ว ทำให้สามารถนำข้อมูลภาพจากกล้องสองตัวมาประกอบกันได้ด้วย
เลนส์ซูมใน Pixel 4 วางห่างจากเลนส์มุมกว้าง 13 มิลลิเมตรทำให้สามารถหาค่า parallax หรือความแตกต่างระหว่างสองมุมมอง ได้อย่างชัดเจนขึ้น ทำให้รู้ความลึกของส่วนต่างๆ ในภาพ ทีมพัฒนาสร้างโมเดลที่นำข้อมูลจาก dual-pixel และข้อมูลจากกล้องสองตัวเข้าโมเดลปัญญาประดิษฐ์ สร้างเป็นภาพความลึก ผลที่ได้คือภาพความลึกรวมมีความชัดเจนขึ้นมาก เช่นภาพคนจะสามารถตัดขอบได้ชัดขึ้น
ซัมซุงประกาศความร่วมมือกับ Baidu ผลิตชิป Baidu KUNLUN สำหรับการประมวลผลปัญญาประดิษฐ์ด้วยเทคนิคการแพ็กเกจชิปแบบ I-Cube ของซัมซุงทำให้เชื่อมต่อหน่วยประมวลผลเข้ากับความจำได้ประสิทธิภาพสูง
ชิป KUNLUN สามารถคำนวณได้ 260 TOPS (ไม่ระบุประเภทคำสั่งอาจจะเป็น integer 8 บิต) และสามารถส่งข้อมูลจากหน่วยความจำได้สูงถึง 512 กิกะไบต์ต่อวินาที กินพลังงานสูงสุด 150 วัตต์ โดยประสิทธิภาพการรันโมเดลปัญญาประดิษฐ์ (inference) ที่ชื่อว่า Ernie ซึ่งเป็นโมเดลประมวลผลภาษาสูงกว่าการใช้ชิปกราฟิกสามเท่าตัว
อินเทลประกาศเข้าซื้อกิจการบริษัท Habana Labs ผู้ผลิตชิปทั้งสำหรับการฝึกโมเดลปัญญาประดิษฐ์และการรันโมเดล มูลค่าการซื้อขาย 2,000 ล้านดอลลาร์หรือ 60,000 ล้านบาท
Habana Labs มีสินค้าหลักสองตัว คือ Gaudi ชิปฝึกโมเดลปัญญาประดิษฐ์ที่ขยายระบบได้มาก และบริษัทระบุว่าประสิทธิภาพดีกว่าการใช้ชิปกราฟิกถึง 4 เท่าตัว อีกตัวคือ Goya ชิปรันโมเดล (inference) ประสิทธิภาพสูง รันโมเดล ResNet-50 ได้ที่ 15,453 ภาพต่อวินาที
KBTG หรือ KASIKORN Business-Technology Group ประกาศความร่วมมือกับ ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (NECTEC ในสังกัด สวทช.) และจุฬาลงกรณ์มหาวิทยาลัยเปิดตัวโครงการ Thai NLP ร่วมพัฒนาเทคโนโลยีประมวลผลภาษาธรรมชาติของภาษาไทย โดยเปิดเป็น Open API และตั้งเป้าสร้างและพัฒนาระบบนิเวศน์ ไปจนถึงชุมชนของ NLP ภาษาไทยขึ้นมาเอง โดยมีคุณขัตติยา อินทรวิชัย กรรมการผู้จัดการ ธนาคารกสิกรไทยมาเป็นประธานในการเปิดตัว NLP
BMW Innovation Lab ปล่อยซอร์สโค้ดระบบช่วยจัดการปัญญาประดิษฐ์ในองค์กรโดยควบคุมการฝึกโมเดลได้ผ่านทางหน้าเว็บทั้งหมด ไม่ต้องลงไปเขียนโค้ดเอง
โมเดลปัญญาประดิษฐ์ที่โครงการรองรับ มีเฉพาะปัญหากลุ่มการตรวจจับวัตถุ (object detection) เท่านั้น โดยผู้ใช้สามารถเตรียมชุดข้อมูลไว้ล่วงหน้า จากนั้นคอนฟิกการฝึก เช่นจำนวนรอบฝึก, การแบ่งชุดข้อมูลทดสอบ จากหน้าเว็บแล้วสั่งฝึกโมเดลได้ทันที
การทดลองใช้โมเดลเปิดเป็น REST API ให้พร้อม GUI สำหรับทดสอบทางหน้าเว็บเช่นกัน
ก่อนหน้านี้ Google Assistant ประกาศเพิ่มความสามารถใหม่ Assistant's Interpreter mode สามารถแปลภาษาและการสนทนายาวๆ ได้แบบเรียลไทม์ ล่าสุดเริ่มเปิดใช้งานในโทรศัพท์ทั้ง iOS และแอนดรอยด์แล้วทั่วโลก ครอบคลุม 44 ภาษา มีภาษาไทยด้วย
ผู้ใช้งานจะต้องพูดคำสั่งให้แปล เช่น Ok Google Be my Italian interpreter, Help me speak Spanish, Interpret from Polish to Dutch, Chinese interpreter, Turn on interpreter mode เป็นต้น จากนั้นก็พูดภาษาถิ่นของตัวเอง ระบบจะแสดงคำแปลและเสียงพูดให้ทันทีที่พูดจบ
AWS ประกาศความร่วมมือกับ NFL สร้างปัญญาประดิษฐ์วิเคราะห์ข้อมูลเพื่อลดความเสี่ยงที่นักกีฬาจะบาดเจ็บในอนาคต โดยระบบนี้อาศัยเครื่องมือของ AWS เช่น SageMaker, Rekognition, และบริการ Amazon ML Solutions Lab ที่เป็นบริการสร้างระบบปัญญาประดิษฐ์เฉพาะสำหรับลูกค้าแต่ละราย
ในการร่วมมือกับ NFL ครั้งนี้ ทาง AWS พัฒนาโมเดลปัญญาประดิษฐ์เพื่อจับภาพโครงร่าง (skeleton) ของนักกีฬาจากวิดีโอของ NFL จากนั้นวิเคราะห์ทั้งตำแหน่งของนักกีฬาในสนาม, รูปแบบการเล่น, อุปกรณ์ที่สวมใส่, สภาพแวดล้อม, และข้อมูลการบาดเจ็บของนักกีฬา
ทั้งสององค์กรหวังว่าข้อมูลจากระบบนี้จะทำให้ NFL สามารถปรับปรุงทั้งกติกาการแข่งขัน, พัฒนาอุปกรณ์, และกระบวนการรักษาตัวนักกีฬา
AWS ประกาศอัพเดตชุดบริการ Amazon SageMaker แพลตฟอร์มพัฒนาและรันโมเดลปัญญาประดิษฐ์ชุดใหญ่ ทำให้ตอนนี้นักพัฒนาสามารถพัฒนาและทดสอบโมเดลปัญญาประดิษฐ์บน Amazon SageMaker ได้สำเร็จในตัว บริการที่เปิดตัวเพิ่มเติมได้แก่
อุบัติเหตุบนท้องถนนเพราะคนขับเล่นโทรศัพท์มีเป็นระยะ ๆ โดยกรมขนส่งรัฐนิวเซาท์เวลส์ ประเทศออสเตรเลียเริ่มใช้กล้องจราจรทำงานร่วมกับ AI คอยถ่ายภาพว่าผู้ใช้รถกำลังใช้มือถือระหว่างขับรถหรือไม่เป็นที่แรกของโลกเพื่อลดการเกิดอุบัติเหตุบนท้องถนนลง
ตามกฏหมายของรัฐนิวเซาท์เวลส์ ถ้าผู้ขับขี่ต้องการใช้โทรศัพท์ระหว่างขับรถต้องใช้อุปกรณ์ handsfree เช่นหูฟังบลูทูธเท่านั้น ถ้าผู้ขับรถกำลังถือโทรศัพท์แนบหู, วิดีโอคอล, เล่นโซเชียลหรือถ่ายภาพจะผิดกฏหมาย โดยกล้องจราจรจะตรวจจับและถ่ายภาพส่งให้ AI ทำหน้าที่ตรวจคัดภาพที่เห็นว่าผู้ขับขี่กำลังใช้มือถืออยู่และมีเจ้าหน้าที่คอยตรวจสอบความถูกต้องของภาพอีกครั้ง
Lee Sedol แชมป์โกะมือหนึ่งผู้เดียวที่เคยชนะ AlphaGo ได้หนึ่งกระดาน ประกาศวางมือจากการแข่งโกะมืออาชีพ โดยระบุว่า แม้จะเป็นที่หนึ่งแต่เขาก็รู้ตัวว่าจะมี "สิ่งหนึ่ง" (entity) ที่เหนือกว่าเสมอ นั่นคือปัญญาประดิษฐ์
แม้จะวางมือจากการเล่นมืออาชีพ แต่ Lee Sedol มีกำหนดแข่งกับปัญญาประดิษฐ์ที่ชื่อว่า Handol ที่สร้างโดยบริษัท NHN ซึ่งเป็นบริษัทไอทีขนาดใหญ่ในเกาหลีใต้ โดจะแข่ง 3 กระดานระหว่างวันที่ 18-20 ธันวาคมนี้
ทีมวิศวกรด้าน AI ของ Facebook ได้เขียนบล็อกอธิบายเบื้องหลังการทำงานของส่วน Explore ใน Instagram ที่จะแนะนำโพสต์ที่ผู้ใช้งานแต่ละคนน่าจะสนใจ โดยมีประเด็นสำคัญหลายอย่าง
กระบวนการคัดเลือกโพสต์เพื่อมานำเสนอใน Explore แต่ละคนนั้น Facebook เรียกว่าผ่านตัวกรอง 3 ระดับ เริ่มต้นจากการนำโพสต์จำนวนหลายพันล้านโพสต์ มาจำแนกผ่านโมเดลมากกว่า 90 ล้านตัวแบบ โดยคัดเลือกโพสต์ที่ดีและเป็นเนื้อหาใหม่
เราคุ้นเคยกับการรีวิวร้านอาหารต่าง ๆ ในอินเทอร์เน็ต แต่มีบริษัทจากญี่ปุ่นแห่งหนึ่งพยายามนำข้อมูลรีวิวเหล่านี้มาคัดเลือกร้านที่ดีจริง ๆ อีกหนึ่งขั้นด้วย AI
TDAI Lab ได้พัฒนาโมเดล AI ต้นแบบ เพื่อคัดเลือกรีวิวร้านอาหารในออนไลน์ที่ดีจริง ๆ ออกมา โดยตัวอย่างที่นำเสนอคือการค้นหาร้านราเม็งที่ดีที่สุดในโตเกียว ซึ่งผลจากการคัดกรองรีวิวพบว่าร้านเหล่านั้น ต้องมีอย่างน้อย 100 รีวิวบนกูเกิล และผู้รีวิวต้องเขียนรีวิวอย่างน้อย 5 ร้านที่แตกต่างกัน จึงจะเป็นรีวิวที่ดี
ผลลัพธ์ของโมเดลจาก TDAI Lab พบว่าร้านราเม็งที่ดีที่สุดในโตเกียวคือ Aoshima Shokudou ในย่านอากิฮาบาระ ซึ่งร้านนี้อันดับในกูเกิลเองอยู่ที่ 13
เราเห็นกูเกิลโชว์ Google Duplex ฟีเจอร์ที่ใช้ AI คุยโทรศัพท์นัดหมายได้แทนมนุษย์ มาตั้งแต่ปี 2018 (รายละเอียดในเชิงเทคนิค) ฝั่งบริษัทฟากเอเชียอย่าง LINE ที่มีฝ่ายพัฒนา AI ชื่อ LINE Brain ก็มีโครงการบ็อตคุยโทรศัพท์ลักษณะเดียวกันชื่อว่า LINE Duet (ชื่อในการค้าคือ LINE AiCall ส่วน LINE Duet คือชื่อโครงการ)
ในยุคที่บริษัทไอทีทุกแห่งหันมาทำเรื่อง AI กันอย่างจริงจัง โฟกัสคงไปอยู่ที่บริษัทฝั่งอเมริกัน-จีนเสียเป็นส่วนใหญ่ แต่จริงๆ แล้ว LINE ในฐานะบริษัทเทคโนโลยีฝั่งเอเชีย (ลูกผสมเกาหลี-ญี่ปุ่น) ก็มีโครงการด้าน AI อย่างจริงจัง โดยใช้ชื่อว่า LINE Brain
ตัวอย่างผลงานของ LINE Brain ที่เปิดให้ใช้กันแล้วคือ ฟีเจอร์ OCR แปลงรูปเป็นข้อความ พร้อมแปลภาษาให้ในตัว แต่ LINE ยังมีงานวิจัยด้านอื่นๆ อีกมาก ไม่ว่าจะเป็นเทคโนโลยีด้านเสียง วิดีโอ รูปภาพ ภาษา วิเคราะห์ใบหน้า
ในงาน LINE Developer Day 2019 มีเดโมของเทคโนโลยีบางตัวมาโชว์ให้ดูกัน
ผู้ใช้ Gmail คงคุ้นเคยกับฟีเจอร์ Smart Compose ที่กูเกิลใช้ AI คาดเดาว่าเราจะเขียนอะไร และเสนอคำหรือวลีถัดไปมาให้เป็นตัวสีเทาๆ
ฟีเจอร์นี้กำลังจะมาอยู่บน Google Docs ด้วย ในแง่การใช้งานไม่มีอะไรแตกต่างกันเลย (เพราะเป็นเอนจินตัวเดียวกัน) ตอนนี้เปิดทดสอบแล้วแบบ Beta (ต้องให้แอดมินองค์กรเป็นผู้สมัครเข้าทดสอบก่อน) และยังรองรับเฉพาะภาษาอังกฤษเท่านั้น
ไมโครซอฟท์ร่วมกับบริษัท Graphcore ให้บริการชิปปัญญาประดิษฐ์เฉพาะทางเป็นในกลุ่มปิด โดยทาง Graphcore อ้างว่าโมเดลที่รันบนชิป C2 IPU ของตัวเองนั้นประสิทธิภาพสูงกว่ามาก ทั้งในแง่ปริมาณข้อมูลที่ประมวลผลได้ (throughput) และในแง่ระยะเวลาหน่วง (latency)
IPU หรือ Intelligence Processing Unit ของ Graphcore นั้นบริษัทระบุว่าเป็นสถาปัตยกรรมที่ต่างออกไปจากทั้งซีพียูและชิปกราฟิกทุกวันนี้ เมื่อเชื่อมต่อชิป IPU 16 คอร์เข้าด้วยกันจะสามารถรันโปรแกรมที่อิสระจากกันได้กว่า 100,000 โปรแกรม
ตัวซอฟต์แวร์ของ Graphcore ชื่อว่า Poplar เป็นชุดเครื่องมือสำหรับการทำงานกราฟ สามารถทำงานร่วมกับ TensorFlow และ ONNX ได้ โดยจะมีรันไทม์สำหรับ ONNX ให้ ส่วนการรองรับ PyTorch จะตามมาภายหลัง
กูเกิลขยายงานวิจัยในการใช้ปัญญาประดิษฐ์คัดกรองภาวะเบาหวานขึ้นจอประสาทตา (Diabetic Retinopathy) ในไทย ภายใต้ความร่วมมือกับโรงพยาบาลราชวิถี สังกัดกรมการแพทย์ กระทรวงสาธารณสุข ขยายการวิจัยจาก 1 คลีนิก เป็น 8 คลีนิก ครอบคลุม 3 จังหวัด ได้แก่ กรุงเทพฯ ปทุมธานี และเชียงใหม่
ที่งาน Singapore FinTech Festival รองนายกรัฐมนตรีสิงคโปร์ Heng Swee Keat ประกาศแนวทางการใช้ปัญญาประดิษฐ์เพื่อเพิ่มประสิทธิภาพการให้บริการมีสองโครงการสำคัญ คือการนำมาให้บริการสุขภาพ และบริการผ่านแดนตามจุดตรวจต่างๆ
โครงการด้านสุขภาพนั้น Heng ระบุว่าสิงคโปร์เตรียมใช้ปัญญาประดิษฐ์ Selena+ มาตรวจภาพดวงดาเพื่อวินิจฉัยโรคเบาหวานขึ้นตา โดยคาดว่าจะใช้ได้ในสถานพยาบาลทั่วสิงคโปร์ภายในปี 2022
เมื่อปีที่แล้ว กูเกิลก็เคยประกาศผลความร่วมมือกับโรงพยาบาลราชวิถี สร้างโมเดลปัญญาประดิษฐ์ตรวจเบาหวานขึ้นตา ได้ความแม่นยำถึง 97%
อินเทลเปิดตัวชิปปัญญาประดิษฐ์ชุดใหม่ NNP-T1000 และ NNP-I1000 คู่ชิปสำหรับการฝึกโมเดลปัญญาประดิษฐ์ และการรันโมเดล
ชิป NNP-T1000 (Spring Crest) เป็นชิปสำหรับฝึกโมเดลปัญญาประดิษฐ์ ประสิทธิ์ภาพ 119 TOPS สำหรับการคำนวณ bfloat16 มีแรมบนชิปโดยตรง 60MB จุดขายสำคัญคือการสื่อสารประสิทธิภาพสูงระหว่างชิป ที่สามารถรันโมเดล เช่น Resnet-50 หรือ BERT ที่การ์ด 32 ใบบนเครื่องเดียวกัน และยังได้ประสิทธิภาพ 95% ของพลังประมวลผลดิบ (near linear scaling) ทำให้ฝึกโมเดลขนาดใหญ่มาก เช่น BERT-large ที่มีขนาดใหญ่กว่า 500MB โดยยังได้ประสิทธิภาพสูง
ชิปตัวนี้เป็นความร่วมมือกับไปตู้ ในฐานะผู้ใช้คนแรกๆ
เป็นธรรมเนียมของงาน Adobe Max ทุกปีที่ต้องมี Sneaks โชว์ฟีเจอร์ใหม่ๆ ที่คิดค้นโดยนักวิจัยในของ Adobe ที่อาจจะได้เปิดใช้งานในแอพพลิเคชั่นอย่างใดอย่างหนึ่งหรือไม่เปิดใช้เลยก็ได้ โดยปีนี้มีโปรเจกต์ใหม่ๆ ดังนี้
NVIDIA เปิดตัว Jetson Xavier NX ชิปซุปเปอร์คอมพิวเตอร์สำหรับประมวลผล AI ที่ NVIDIA บอกว่าเล็กที่สุดในโลกด้วยขนาด 70x45 มิลลิเมตร สำหรับการประมวลผลในอุปกรณ์ปลายทาง (the edge) ในอุปกรณ์ประเภทฝังตัว (embeded device) หรือหุ่นยนต์ต่าง ๆ
Jetson Xavier NX มีกำลังประมวลผลสูงสุด 21 TOPS ที่กำลังไฟ 15W (ส่วนไฟ 10W จะสามารถประมวลผลได้ที่ 14 TOPS) ซีพียูเป็น ARM64 สถาปัตยกรรม Carmel 6 คอร์ จีพียู NVIDIA Volta มี CUDA Core 384 คอร์, Tensor Core อีก 48 คอร์ และ NVDLA ตัวเร่งการประมวลผล Deep Learning 2 ตัว แรม LPDDR4x 128-bit ขนาด 8GB
ราคาของ Jetson Xavier NX อยู่ที่ 399 เหรียญ จะเริ่มผลิตและวางขายเดือนมีนาคมปี 2020 ที่จะถึงนี้
ไมโครซอฟท์อัพเดต Visual Studio IntelliCode ฟีเจอร์แนะนำการเขียนโค้ดด้วยปัญญาประดิษฐ์ที่เปิดตัวเมื่อปีที่แล้ว ตอนนี้ตัว IntelliCode ก็มีฟีเจอร์เพิ่มขึ้น คือการแนะนำโค้ดทั้งบรรทัดแทนที่จะเป็นการแนะนำตัวแปรหรือฟังก์ชั่นต่อไปเท่านั้น และฟีเจอร์การปรับปรุงโค้ด (refactoring) ตามตัวอย่างที่เคยปรับแก้มาก่อนหน้า
ไมโครซอฟท์ทยอยเพิ่มฟีเจอร์ด้าน AI ให้กับแอพในกลุ่ม Office อยู่เรื่อยๆ รอบนี้เป็นคิวของ Excel ที่ได้ฟีเจอร์สำคัญคือรองรับการค้นหาด้วยภาษาธรรมชาติ (natural language query) เพื่อเราสามารถดูสรุปข้อมูลในตาราง โดยไม่ต้องใส่สูตร!
ตัวอย่างการใช้งานเช่น เรามีข้อมูลยอดขายสินค้าประเภทต่างๆ อยู่ในตารางอยู่แล้ว เราสามารถพิมพ์ what were the sales for clothing products? ในช่องค้นหา จากนั้น Excel จะสรุปยอดขายของสินค้าหมวดเสื้อผ้าออกมาเป็นชาร์ทให้ทันที
ไมโครซอฟท์ระบุว่าฟีเจอร์นี้จะตอบคำถามของผู้ใช้ออกมาเป็นสูตร, ชาร์ท หรือตาราง pivot table ตอนนี้ยังรองรับเฉพาะภาษาอังกฤษเท่านั้น ใช้ได้กับทั้ง Excel บนวินโดวส์ แมค และเว็บ โดยยังเปิดทดสอบเฉพาะกลุ่ม Office Insiders