Microsoft Garage หน่วยบ่มเพาะนวัตกรรมใหม่ในไมโครซอฟท์ เปิดตัวแอปพลิเคชั่น Group Transcribe แอปบันทึกเสียงการประชุม ที่สามารถถอดเสียงเป็นคำบรรยาย และแปลภาษาในข้อความไปด้วยได้ รองรับ 80 ภาษา รองรับภาษาไทยด้วย ผู้ใช้งานจะได้โฟกัสกับการประชุมเต็มที่โดยไม่ต้องจดโน้ต เปิดให้ใช้งานเฉพาะ iOS แล้วทั่วโลก
วิธีการทำงานของ Group Transcribe คือ เริ่มการประชุมจากในแอป และส่งลิงค์หรือส่ง QR Code ให้คนอื่นเพื่อเชิญให้เข้าร่วมประชุม ในการประชุมผู้ใช้งานต้องวางโทรศัพท์ไว้ในระยะเอื้อมถึง เพื่อให้ระบบถอดเสียงได้เต็มที่
Cisco Webex ประกาศฟังก์ชั่นแปลภาษาเรียลไทม์ จากภาษาอังกฤษเป็น อาหรับ, ดัตช์, ฝรั่งเศส, เยอรมัน, ญี่ปุ่น, เกาหลี, จีนกลาง, รัสเซียและสเปน ซึ่งเริ่มเปิดใช้งานเมื่อเดือนกุมภาพันธ์ที่ผ่านมา ล่าสุด Cisco Webex ประกาศจะขยายไปยังภาษาอื่นๆ ให้ครอบคลุมภาษาท้องถิ่นอย่างเดนมาร์ก, ฮินดี, มาเลย์, ตุรกีและเวียดนาม รวมๆ แล้วกว่า 100 ภาษาตามที่ Cisco ระบุ
กูเกิลเปิดตัวปัญญาประดิษฐ์ Lyra สำหรับการบีบอัดเสียงพูด โดยอาศัยโมเดลดึงเอาคุณลักษณะของเสียงในห้วง 40ms ออกมาเป็นข้อมูลขนาดเล็กส่งไปยังปลายทาง และที่ปลายทางจะมีปัญญาประดิษฐ์แบบ generative สร้างเสียงกลับออกมาอีกครั้ง ทำให้ใช้งานได้แม้แบนวิดท์จะต่ำเหลือเพียง 3kbps เท่านั้น (เสียงโทรศัพท์ปกติใช้แบนวิดท์ 64kbps)
จากกรณี Timnit Gebru นักวิจัยด้านจริยธรรมปัญญาประดิษฐ์ (Ethical AI) เปิดเผยว่าเธอถูกไล่ออกจากกูเกิล จนทำให้พนักงานเข้าชื่อประท้วง และซีอีโอ Sundar Pichai ต้องออกมาขอโทษ
ล่าสุดมีกรณีคล้ายๆ กันขึ้นมาอีก เมื่อ Margaret Mitchell หัวหน้าทีม Ethical AI อีกคน (เป็นระบบหัวหน้าสองคน) เปิดเผยว่ากูเกิลไล่เธอออกเช่นกัน
กรณีของ Mitchell สาเหตุต่อเนื่องมาจากกรณี Gebru เพราะหลังกูเกิลไล่ Gebru ออก ทำให้ Mitchell พยายามเข้าไปหาหลักฐานในระบบอีเมลของบริษัท ทำให้กูเกิลปิดการเข้าถึงบัญชีอีเมลของเธอตั้งแต่เดือนที่แล้ว และไล่ออกในวันนี้
ทีม Google Research ปล่อยโครงการ TensorFlow 3D (TF 3D) โมเดลปัญญาประดิษฐ์สำหรับตรวจจับวัตถุสามมิติโดยเฉพาะ สำหรับใช้งานจากข้อมูลที่ได้จากเซ็นเซอร์สามมิติไม่ว่าจะเป็นโมดูล LIDAR หรือกล้องสามมิติก็ตาม
TF 3D มีโมเดลสำหรับแยกส่วนวัตถุจากข้อมูลสามมิติ (segmentation) และตรวจจับวัตถุ (object detection) การตรวจจับวัตถุจะได้เอาต์พุตเป็นกล่องสามมิติ สามารถบอกจุดศูนย์กลางและทิศทางที่วัตถุหันอยู่ได้
ตัวโครงการพัฒนาบน TensorFlow 2 รองรับชุดข้อมูล Waymo Open (สแกนถนน), ScanNet (ในอาคาร), และ Rio สำหรับการฝึก
ที่มา - Google AI Blog
นับตั้งแต่เกิดวิกฤตขาดแคลนหน้ากากอนามัยใช้ป้องกันการแพร่ระบาดของไวรัสโควิด-19 เมื่อต้นปี 2563 ที่ผ่านมา เครือเจริญโภคภัณฑ์ (ซีพี) โดยคุณธนินท์ เจียรวนนท์ ประธานอาวุโส เครือซีพี ได้ประกาศเจตนารมณ์ที่จะสร้างโรงงานผลิตหน้ากากอนามัยแจกจ่ายฟรีแก่ แพทย์ พยาบาล ตลอดจนบุคลากรทางการแพทย์และสาธารณสุข ที่เป็นด่านหน้าที่ต้องรับมือกับวิกฤตโควิด-19 อย่างเร่งด่วน รวมทั้งประชาชนที่ขาดโอกาส เพื่อเร่งบรรเทาวิกฤตการขาดแคลนหน้ากากอนามัย
จึงได้ก่อตั้ง บริษัท ซีพี โซเชียล อิมแพคท์ จำกัด ขึ้นมาดูแลเปิดโรงงานผลิตหน้ากากอนามัยซีพีใช้เวลาก่อสร้างด้วยความรวดเร็วภายใน 5 สัปดาห์ ให้ความสำคัญและมุ่งเน้นเรื่องคุณภาพและมาตรฐานการผลิตตั้งแต่การออกแบบห้องคลีนรูม (Clean Room) นำเทคโนโลยีที่ทันสมัยเข้ามาใช้ในกระบวนการผลิตและเชื่อมต่อกับระบบ AI ที่ได้รับความร่วมมือจากสถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง (สจล.) เพื่อทำหน้าที่ตรวจสอบคุณภาพการผลิตและการบรรจุ ซึ่งในทุกขั้นตอนเชื่อมต่อเป็นระบบอัตโนมัติและใช้กำลังคนน้อยที่สุดเพื่อให้หน้ากากอนามัยที่ผลิตปลอดเชื้อเป็นไปตามมาตรฐานสากล
Canon เปิดตัวแคมเปญระดมทุนในเว็บไซต์ Makuake สำหรับกล้อง AI ถ่ายภาพอัตโนมัติชื่อว่า PowerShot PICK โดย AI ในตัวมีไว้เพื่อวิเคราะห์ฉาก, ระบุตัวคน, ติดตามหน้า และกำหนดว่าควรจะถ่ายภาพตอนไหน ซึ่ง Canon ระบุว่าตัว PICK นี้เป็นกล้องถ่ายภาพอัตโนมัติที่รวมเลนส์, ระบบประมวลผลวิดีโอ และเทคโนโลยี AI เข้าด้วยกัน
สเปคของตัวกล้อง Canon ใช้เซนเซอร์ 1/2.3 นิ้ว CMOS 12 ล้านพิกเซล พร้อมเลนส์ซูมเทียบเท่าระยะ 19-57mm มีรูรับแสงกว้างสุดที่ F2.8 พร้อมระบบกันสั่นในตัว สามารถแพนกล้องได้ 170 องศา และก้มเงยได้ 110 องศา พร้อมช่องเสียบ microSD โดยตัวกล้องมีน้ำหนัก 170 กรัม สูง 90 มิลลิเมตร
สถาบันวิจัยปัญญาประดิษฐ์ประเทศไทย (VISTEC-depa Thailand Artificial Intelligence Research Institute) ปล่อยโมเดล WangchanBERTa ซึ่งเป็นโมเดลทางภาษาไทยสำหรับงานประมวลผลภาษาธรรมชาติโดยฝึกฝนบนสถาปัตยกรรม RoBERTa
โมเดล WangchanBERTa ถูกฝึกฝนด้วยชุดข้อมูลกว่า 78.48 GB ใช้ตัวตัดคำย่อย SentencePiece ในการแบ่งคำและ ใช้เวลาฝึกฝนโมเดล 3 เดือน
ทำให้โมเดล WangchanBERTa ถือเป็นโมเดลภาษาไทยที่ใหญ่ที่สุด ณ ขณะนี้ ซึ่งในการฝึกฝนใช้ไฟฟ้าทั้งหมด 10,566.5 kWh หรือคิดเป็นรอยเท้าคาร์บอน 7.5 ตัน เทียบเท่าการใช้รถ 1.6 คันในหนึ่งปี
Google เปิดตัวความสามารถ Guest Mode ใน Google Assistant เมื่อใช้คำสั่งเสียง Hey Google, turn on Guest Mode คำสั่งที่ตามมาหลังจากนั้นจะไม่ถูกบันทึกไว้ในระบบ สามารถสั่งงานธรรมดาได้ เช่น ถามข้อมูล สภาพอากาศ เปิดปิดเครื่องใช้ไฟฟ้า
อย่างไรก็ตาม ในโหมด Guest Mode ผู้ใช้งานจะมองไม่เห็นข้อมูลของตัวเองเช่น ตารางเวลาของตัวเอง เป็นต้น Guest Mode จะไม่หายไปจนกว่าผู้ใช้งานจะสั่งปิดด้วยการพูด Hey Google, turn off Guest Mode
ในงาน CES ซัมซุงเผยว่าได้พัฒนา Bot Handy แขนหุ่นยนต์ช่วยงานต่างๆ ในบ้าน เช่น ยกจานเก็บเข้าชั้น จัดโต๊ะ เทเครื่องดื่มลงแก้ว ตรงหัวมุมแขนมีกล้องติดตั้งอยู่ ทางบริษัทอ้างว่า ตัวหุ่นยน๖์สามารถระบุวัตถุที่มีขนาดรูปร่างและน้ำหนักต่างกันได้ รวมถึงสามารถตรวจจับองค์ประกอบวัสดุของรายการและใช้แรงในการจับและเคลื่อนย้ายในปริมาณที่เหมาะสมได้
OpenAI บริษัทวิจัยด้านปัญญาประดิษฐ์ที่มี Elon Musk เป็นผู้ร่วมก่อตั้ง (แต่ตอนนี้ไม่เกี่ยวข้องแล้ว) และมีไมโครซอฟท์ให้การสนับสนุน เปิดตัว DALL·E โปรแกรมปัญญาประดิษฐ์ที่พัฒนาจาก GPT-3 ซึ่งสามารถสร้างสรรค์รูปภาพ จากตัวหนังสืออธิบายรายละเอียดของภาพ (text caption)
Jim Keller วิศวกรออกแบบชิปชื่อดัง ผู้ผ่านงานมาแล้วกับทั้ง Apple, AMD, Tesla, Intel ประกาศเข้าทำงานกับบริษัทพัฒนาชิป AI ชื่อ Tenstorrent
Jim Keller ถือเป็นนักออกแบบชิปที่มีผลงานมากมาย และมีประวัติการทำงานกับบริษัทดังๆ เช่น AMD (2 รอบ รอบแรกทำ K7/K8, รอบหลังช่วยทำ Zen), Tesla (ชิปสำหรับระบบขับเคลื่อนอัตโนมัติ), Apple (A4/A5), Broadcom และตำแหน่งล่าสุดคือ Intel ระหว่างปี 2018-2020
Google เปิดเผยว่าในช่วงเดือนพฤศจิกายนและธันวาคมทุกปี ยอดคำค้นหาอย่างการอบขนม (baking) เพิ่มขึ้นสูงทุกปี ปีนี้ Google เลยเกาะกระแสด้วยการใช้ AI มาช่วยคิดค้นสูตรขนม
ทีมงานใช้ AutoML Table มาแยกและสร้างโมเดลสำหรับขนมแต่ละประเภทอย่างเค้ก, ขนมปังและคุกกี้ออกจากกันด้วยวัตถุดิบและปริมาณของวัตถุดิบแต่ละประเภท ซึ่งสุดท้ายตัว ML สามารถแยกแยะขนมแต่ละประเภทได้แล้ว ยังสามารถสร้างสูตรขนมแบบไฮบริดที่เป็นลูกผสมด้วย เช่น breakie (bread+cookie), cakie (cake+cookie)
ที่มา - Google Blog
ทีมวิจัยจากญี่ปุ่นนำเสนอปัญญาประดิษฐ์เฉพาะทางสำหรับแปลการ์ตูน (มังงะ - manga) โดยนำภาพในการ์ตูนเข้ามาประกอบเพื่อให้คุณภาพการแปลสูงขึ้น
กระบวนแปลภาษาในการ์ตูนนั้นมีความยากกว่าเนื้อหาปกติเพราะข้อความในแต่ละช่องของการ์ตูนมักเป็นข้อความสั้นๆ บางครั้งหากไม่มองเนื้อหาโดยรวมแล้วก็ถึงกับแปลไม่ได้ ทำให้ทีมวิจัยสร้างระบบการแปลแบบมองบริบทจากหลายมุมมอง (multimodal context-aware) โดยมองทั้งลำดับของภาพ, ลำดับของข้อความ, และบริบทผู้พูดข้อความนั้นๆ เช่น เพศของผู้พูด
ทีมงานระบุว่าระบบการแปลที่มองบริบทมาเป็นส่วนร่วมเช่นนี้น่าจะใช้งานประเภทอื่นๆ ได้ด้วย เช่น การทำคำบรรยายภาพยนตร์
DeepMind เผยแพร่ความคืบหน้าของปัญญาประดิษฐ์ MuZero ที่พัฒนาต่อจาก AlphaZero โดยตั้งเป้าหมายเพื่อหาอัลกอริทึมสำหรับโจทย์แบบไม่เจาะจง สามารถเอาชนะในเกมใด ๆ ก็ตาม ที่ไม่รู้กฎกติกามาก่อน
ที่ผ่านมาปัญญาประดิษฐ์ของ DeepMind จะแก้ปัญหาได้เฉพาะเรื่อง (Domain) และอาศัยองค์ความรู้ (Knowledge) ทั้งข้อมูลการเล่นในอดีต จนถึงกติกาการเล่น ซึ่งแนวทางนี้จะพบปัญหาเมื่อต้องเล่นเกมแบบ Atari ที่รูปแบบกติกาไม่ได้บอกชัดเจนมาก และเกมก็ซับซ้อนขึ้น (ดูภาพประกอบด้านล่าง)
จากกรณีกูเกิลเลิกจ้างนักวิจัยด้าน AI ชื่อดัง Timnit Gebru จนซีอีโอ Sundar Pichai ต้องขอโทษพนักงาน
ความคืบหน้าล่าสุดของกรณีนี้คือ พนักงานฝ่ายวิจัย Ethical AI ของกูเกิลได้เข้าชื่อกันส่งจดหมายถึง Sundar Pichai โดยมีข้อเรียกร้องสำคัญคือ
จากกรณีกูเกิลเลิกจ้างนักวิจัยด้าน AI ชื่อดัง Timnit Gebru ในประเด็นเรื่องการตีพิมพ์งานวิจัย AI จนเป็นเหตุให้พนักงานกูเกิลเองกว่า 2,300 คน และนักวิจัยภายนอกอีก 3,700 คนเข้าชื่อประท้วงบริษัท
ล่าสุด Sundar Pichai ซีอีโอของกูเกิลเขียนอีเมลส่งถึงพนักงาน (ที่หลุดออกมาสู่สื่อ) โดยบอกว่ารับทราบปัญหานี้เรียบร้อยแล้ว และยอมรับว่าสร้างความคลางแคลงใจในหมู่พนักงาน-แวดวงนักวิจัยอย่างมาก เขาในฐานะผู้นำองค์กรก็แสดงความขอโทษ และมีภาระรับผิดชอบในการสร้างความเชื่อมั่นกลับคืนมา
ทีมปัญญาประดิษฐ์ CLOVA ของ LINE ประกาศเปิดฟอนต์ลายมือให้ผู้ใช้เปลี่ยนฟอนต์หน้าจอ LINE ไปใช้งานได้ โดยฟอนต์นี้มีความพิเศษคือมันสร้างขึ้นมาจากปัญญาประดิษฐ์สร้างภาพ ที่ใช้ตัวอักษรลายมือจริงๆ เพียง 250 ตัวอักษรเท่านั้น แต่สามารถออกแบบฟอนต์รวมกว่า 10,000 ตัวอักษรออกมาได้
ทีม CLOVA ใช้โมเดลแบบ pix2pix สร้างฟอนต์ลายมือเฉพาะของผู้ใช้ โดยทีมงานระบุว่าการใช้งานจริงอาจจะใช้ในภาพยนต์, โฆษณา, หรือโลโก้บริษัท เพื่อให้ความรู้สึกอบอุ่นจากการใช้ลายมือแทนตัวพิมพ์ นอกจากนี้แล้วทาง CLOVA ยังใช้โมเดลสร้างฟอนต์ไปสร้างข้อความเพื่อฝึกปัญญาประดิษฐ์ในการทำ OCR อีกต่อหนึ่ง เพื่อปรับปรุงความแม่นยำของบริการให้อ่านลายมือได้ดีขึ้น
สัปดาห์ที่ผ่านมา Timnit Gebru นักวิจัยด้านจริยธรรมปัญญาประดิษฐ์ (Ethical AI) ได้ออกมาเปิดเผยว่าเธอถูกไล่ออกจากกูเกิลหลังจากพยายามตีพิมพ์งานวิจัยใหม่แต่ถูกผู้บริหารกูเกิลสั่งให้ถอนงานวิจัยออก จนเธอยื่นคำขาดว่าหากไม่ได้ตีพิมพ์งานวิจัยชิ้นนี้เธอจะลาออกจากบริษัท หลังจากนั้นเธอได้รับอีเมลว่าบริษัทตอบรับการลาออกของเธอและเตรียมให้เธอคืนอุปกรณ์ของกูเกิลในภายหลัง และพนักงานกูเกิลจำนวนมากแสดงความไม่พอใจจนลงชื่อไม่เห็นด้วยต่อการเลิกจ้างครั้งนี้มากกว่า 1,500 คน
Loon บริษัทพัฒนาบอลลูนปล่อยสัญญาณอินเทอร์เน็ตอัตโนมัติของ Alphabet ร่วมมือกับ Google AI เพื่อนำระบบ AI แบบ reinforcement learning (RL) มาใช้ในระบบนำทางของบอลลูน ทดแทนระบบปัจจุบันซึ่งเป็นอัลกอริทึมที่พัฒนาโดยมนุษย์
Loon ระบุว่า ระบบนำทางแบบ RL จะเป็นระบบพัฒนาอัลกอริทึมการเดินบอลลูนโดยใช้ AI ล้วน ๆ คำนวณตั้งแต่เส้นทางเดินบอลลูนที่เหมาะสม ซึ่งรวดเร็วและมีประสิทธิภาพกว่าระบบที่พัฒนาโดยมนุษย์มาก เท่ากับว่าตัวบอลลูนจะใช้พลังงานน้อยลงแต่สามารถเดินทางได้เท่าเดิมหรือไกลกว่าเดิม
NVIDIA ประกาศเซ็นบันทึกความเข้าใจ (MoU) ด้านการพัฒนา AI และคอมพิวเตอร์สมรรถนะสูง HPC กับหน่วยงานด้านวิจัยในประเทศไทย คือมหาวิทยาลัย 6 แห่งคือ จุฬาฯ, ลาดกระบัง, CMKL (สถาบันร่วมของลาดกระบัง), ขอนแก่น, มหิดล, สงขลาฯ ที่เรียกว่า ภาคีเครือข่ายมหาวิทยาลัยปัญญาประดิษฐ์ไทย (Thailand A.I. University Consortium
ภายใต้ MoU ฉบับนี้ ประเทศไทยจะเป็นประเทศแรกในเอเชียตะวันออกเฉียงใต้ที่เข้าร่วมโครงการ NVIDIA AI Nations โดยจะได้รับความร่วมมือจาก NVIDIA ทั้งด้านส่งเสริมสตาร์ตอัพ (Inception Program), การวิจัยด้าน Deep Learning
AWS เปิดบริการเจาะกลุ่มโรงงานสองตัวพร้อมกัน คือ Amazon Panorama คอมพิวเตอร์ประมวลผลภาพจากกล้องวงจรปิด และ Amazon Lookout บริการหาจุดบกพร่องของสินค้าในกระบวนการผลิต
เริ่มต้นการเป็นมืออาชีพในการดำเนินธุรกิจอย่างชาญฉลาด ด้วยเทคโนโลยีปัญญาประดิษฐ์หรือ AI ให้มาเป็นผู้ช่วยที่ไว้วางใจได้ มีความถูกต้องแม่นยำสูง ลดความผิดพลาด และพร้อมจะเรียนรู้เพื่อพัฒนาศักยภาพการทำงานให้ดีขึ้นอยู่เสมอ ตอบสนองการดำเนินธุรกิจแบบก้าวกระโดด
NVIDIA เปิดตัว Medical Open Network for AI (MONAI) เฟรมเวิร์คโอเพนซอร์สสำหรับ AI วิเคราะห์ภาพถ่ายทางการแพทย์ (medical imaging เช่น x-ray, CT, MRI, ultrasound) ตัวมันเองพัฒนาจาก PyTorch โดยมีโมเดลที่เทรนมาให้พร้อมใช้งานแล้ว 20 ตัว รวมถึงโมเดลใหม่ๆ ที่สร้างขึ้นมาสำหรับ COVID-19 ด้วย
MONAI เริ่มพัฒนาโดย NVIDIA และ King’s College London แต่ภายหลังก็มีสถาบันวิจัยด้านการแพทย์ในหลายประเทศ เช่น สหรัฐอเมริกา เยอรมนี และจีน เข้ามาร่วมพัฒนาด้วย
DeepMind เปิดตัวปัญญาประดิษฐ์ AlphaFold2 สำหรับการทำนายโครงสร้างการ "พับ" ของโปรตีน ทำให้นักวิทยาศาสตร์สามารถทำนายกระบวนการทำงานของโปรตีนแต่ละตัวได้รวดเร็วขึ้นในราคาถูกลง เปิดทางการพัฒนายาให้รวดเร็วยิ่งขึ้น