Demining Research Community คือองค์กรไม่แสวงหาผลกำไรที่พยายามพัฒนาเทคโนโลยีเพื่อการเก็บกู้กับระเบิด ซึ่งในปัจจุบันทีมวิจัยขององค์กรได้พัฒนาระบบค้นหาและระบุตำแหน่งกับระเบิดด้วยภาพถ่ายทางอากาศที่ได้จากการบินถ่ายภาพด้วยโดรน เป้าหมายขององค์กรคือช่วยให้ภารกิจการเก็บกู้กับระเบิดในประเทศต่างๆ ทั่วโลกที่ยังคงหลงเหลืออยู่แม้สงคราบจะจบไปนานแล้วสามารถทำได้อย่างปลอดภัยและมีประสิทธิภาพยิ่งขึ้น
Google Research และหุ่นยนต์ผู้ช่วย Everyday Robots เปิดตัวโมเดล Machine Learning เพื่อให้หุ่นยนต์เข้าใจคำสั่งแบบ NLP และสามารถปฏิบัติต่อได้อย่างถูกต้อง โดยมีชื่อว่า PaLm-SayCan
กูเกิลบอกว่า PaLm-SayCan เป็นการเรียนรู้ชุดภาษาธรรมชาติ และแปลงออกมาเป็นการกระทำสำหรับหุ่นยนต์ ผู้ใช้งานอาจป้อนข้อมูลด้วยการสั่งผ่านเสียงหรือส่งข้อความ โดยมีได้ทั้งงานง่าย ๆ ไปจนถึงงานที่มีความซับซ้อนต้องตีความ
ตัวอย่างคำสั่งเช่น "ฉันทำน้ำส้มหก ช่วยจัดการให้หน่อย แล้วทำความสะอาด จากนั้นขอกระป๋องใหม่ด้วย" หุ่นยนต์จะคำนวณความเป็นไปได้ แล้วแปลงออกมาเป็น 3 งาน เริ่มจากเก็บกระป๋องไปทิ้ง ไปหยิบผ้าเช็ด แล้วเอาน้ำส้มกระป๋องใหม่มาให้ เป็นต้น
AWS เปิดตัวบริการ Amazon CodeWhisperer เพื่อน AI ช่วยเขียนโค้ด ลักษณะเดียวกับ GitHub Copilot ที่เพิ่งเปิดบริการเต็มรูปแบบ
AWS บอกว่าเทรน machine learning ด้วยข้อมูลโค้ดหลายพันล้านบรรทัด (ทั้งจากโค้ดภายในบริษัทเอง และโค้ดที่เป็นโอเพนซอร์ส) เพื่อให้ CodeWhisperer สามารถอ่านโค้ดและคอมเมนต์ในโค้ดของเรา แล้วให้คำแนะนำการเขียนโค้ดที่ดีขึ้นในแง่มุมต่างๆ โดยผู้ใช้งานสามารถเลือกทำตาม CodeWhisperer ทันที หรือจะแก้ไขแล้วคัสตอมคำแนะนำแบบที่เราต้องการก็ได้
ในเดโมที่ AWS นำมาโชว์ เป็นไฟล์เปล่าที่มีคอมเมนต์ว่า "See if a number is prime" เมื่อกดเลือกคำแนะนำ เราก็จะได้โค้ดมาตามภาพทันที
กูเกิลรายงานผลของการนำ Machine Learning มาใช้กับเบราว์เซอร์ Chrome รวมทั้งโครงการในอนาคต เพื่อให้เป็นเบราว์เซอร์ที่ปลอดภัย และปรับแต่งให้เข้ากับการใช้งานแต่ละคนมากยิ่งขึ้น
โดย Safe Browsing ฟีเจอร์แจ้งเตือนเว็บไซต์ที่อันตราย กูเกิลบอกว่าตั้งแต่เดือนมีนาคมที่ผ่านมา ได้ปรับปรุง ML ใหม่ ทำให้ตรวจจับเว็บไซต์ที่อันตรายได้มากขึ้น 2.5 เท่า
ส่วนต่อมาคือการปรับปรุงประสบการณ์ใช้งาน โดยเฉพาะ Web Notification ซึ่งในอัพเดตถัดไป Chrome จะเรียนรู้รูปแบบการโต้ตอบกับการขอแจ้งเตือนของเว็บไซต์ต่าง ๆ ของผู้ใช้งาน และบล็อกหรืออนุญาตอัตโนมัติในการถามครั้งถัดไปที่ระดับอุปกรณ์เลย
Bloomberg รายงานข่าวว่า Ian Goodfellow ผู้อำนวยการฝ่าย Machine Learning ของแอปเปิลที่เพิ่งลาออก ซึ่งคาดว่าเป็นเพราะนโยบายของแอปเปิลให้กลับเข้าทำงานที่ออฟฟิศ ล่าสุดย้ายไปอยู่กับ DeepMind บริษัทลูกของ Alphabet แทนแล้ว
ตัวของ Goodfellow เองเคยเป็นนักวิจัยกับกูเกิลมาก่อนแล้วสองรอบ รอบแรกอยู่กับทีม Google Brain ก่อนย้ายไป OpenAI แล้วกลับมากับ Google Research จนถึงปี 2019 จึงย้ายไปอยู่กับแอปเปิล การกลับมารอบนี้ (ถึงแม้ไปอยู่กับ DeepMind ไม่ได้อยู่กับกูเกิลตรงๆ) ก็เป็นเหมือนการกลับบ้านเก่าของเขานั่นเอง
Google Cloud ประกาศบริการ Cloud TPU VMs เข้าสถานะเสถียร general availability (GA)
กูเกิลมีหน่วยประมวลผล TPU (Tensor Processing Unit) ที่ออกแบบเองสำหรับเร่งความเร็ว AI มาตั้งแต่ปี 2017 และเปิดให้คนทั่วไปเช่ารัน-เทรนโมเดล machine learning ผ่าน Google Cloud มาตั้งแต่ปี 2018 ในชื่อบริการ Cloud TPU
แต่ที่ผ่านมา การเช่า TPU ยังเป็นการเช่า VM บนเครื่องอื่นแล้วรีโมทเข้าไปเรียก TPU ผ่านโปรโตคอล gRPC เท่านั้น ผู้ใช้ไม่สามารถเข้าถึงเครื่อง TPU โดยตรงได้ (ดูภาพประกอบ)
Max Woolf นักวิทยาศาสตร์ข้อมูลของเว็บไซต์ Buzzfeed ลองเขียน AI ให้เรียนรู้ภาพวาดโปเกมอนทุกตัว และลองสร้างโปเกมอนของตัวเองขึ้นมาเป็นภาพวาด ซึ่งผลที่ได้ค่อนข้างน่าประทับใจ เพราะมีลายเส้นและสไตล์เหมือนกับโปเกมอนต้นฉบับมาก
Woolf ยังเปิดเผยซอร์สโค้ดที่เขาใช้ประมวลผลรูปภาพโปเกมอนขึ้นบน GitHub เพื่อให้ได้ภาพในฟอร์แมตที่เตรียมนำไปใช้เทรน AI ต่อได้
งานของ Woolf ยังทดลองใช้ AI สร้างตัวละครจากเกมหรืออนิเมะดังๆ อยู่บ่อยครั้ง ตัวอย่างอื่นๆ ที่เขาลองทำคือสร้างตัวละครจากเกม Genshin Impact ขึ้นมาใหม่
AWS เปิดตัว Amazon SageMaker Canvas เครื่องมือสร้างโมเดล machine learning (ML) แบบลากแล้ววาง ไม่ต้องเขียนโค้ดเอง (no-code) เพื่อให้นักวิเคราะห์ข้อมูลธุรกิจสามารถสร้างโมเดลการพยากรณ์ได้ง่ายขึ้น
SageMaker Canvas ใช้ฐานมาจาก Amazon SageMaker เครื่องมือสร้างโมเดล ML ที่ออกมาได้นานพอสมควร และใช้งานกันอย่างแพร่หลาย
วิธีการใช้งาน SageMaker Canvas คือนำเข้าข้อมูล (เช่น ไฟล์ CSV หรือเชื่อมต่อฐานข้อมูล) นำข้อมูลมาเชื่อมต่อกันเป็นชุดเดียว (join dataset) แล้วสร้างโมเดลจากตารางข้อมูลที่มี ก่อนเริ่มเทรนโมเดลจากข้อมูลจริง
โอกาสสำหรับคนสายเทคโนโลยีและ Start-up ที่ต้องการลับคมตัวเองมาแล้ว กับงาน ARV Hackathon 2021 พร้อมโจทย์สุดท้าทายที่ผู้เข้าร่วมจะได้ใช้ทักษะ สร้างโซลูชั่นที่นำมาใช้จริงในอุตสาหกรรมพลังงาน
AI and Robotics Ventures หรือ ARV มุ่งมั่นสู่การเป็นศูนย์กลางของธุรกิจเทคโนโลยีปัญญาประดิษฐ์ และหุ่นยนต์ (Artificial intelligence and Robotics) ที่ล้ำสมัยอย่างครบวงจร เพื่อสร้างธุรกิจให้เติบโตอย่างก้าว กระโดด และเป็นแหล่งรายได้ใหม่ให้กับ บริษัท ปตท.สำรวจและผลิตปิโตรเลียม จำกัด (มหาชน) หรือ ปตท. สผ. ซึ่งปีนี้ ARV ได้นำหัวข้อ Cyber Security และ Subsea Machine Learning มาเป็นโจทย์หลักของงาน ARV Hackathon 2021 เฟ้นหาสุดยอดทีมนักพัฒนาที่อยากท้าทายตัวเอง และสนใจเทคโนโลยี ร่วมโชว์ศักยภาพสร้างสรรค์นวัตกรรมและพัฒนาโซลูชั่นใหม่ๆ ที่สามารถสร้างความปลอดภัยให้กับโลกไซเบอร์ ปกป้องข้อมูล และแก้ไขช่องโหว่ของระบบที่มีในปัจจุบัน ตลอดจนถึงการพัฒนาขีดความสามารถของปัญญาประดิษฐ์ เพื่อต่อยอดธุรกิจในทุกอุตสาหกรรมได้อย่างมีประสิทธิภาพ
ไมโครซอฟท์ออก Visual Studio Code 1.59 มีฟีเจอร์ที่น่าสนใจ (ยังเป็นฟีเจอร์ระดับพรีวิว) คือ automatic language detection ตรวจหาว่าโค้ดที่พิมพ์ลงไปเป็นโค้ดภาษาอะไร โดยใช้ machine learning เพื่อเซ็ตโหมดการทำงานให้ตรงกับภาษาโปรแกรมที่ใช้งาน
ปกติแล้ว IDE หรือ code editor ใช้วิธีดูนามสกุลไฟล์เพื่อดูว่าเป็นภาษาโปรแกรมใด แต่ในกรณีที่เป็นไฟล์ untitled (เช่น การนำโค้ดจากที่อื่นมาแปะในไฟล์ว่าง) จะมีความยากในการตรวจสอบกว่าเดิม
Google Maps เปิดตัวฟังก์ชั่นดูความหนาแน่นของผู้คนตามขนส่งมวลชนสาธารณะ มาตั้งแต่ปี 2019 ในตอนนั้นเปิดใช้งานราว 200 เมืองใหญ่ทั่วโลก ล่าสุดกูเกิลขยายการใช้งานเพิ่มครอบคลุมหน่วยงานขนส่งสาธารณะ 1 หมื่นหน่วยงาน ใน 100 ประเทศ
MLCommons หน่วยงานกลางสำรวจประสิทธิภาพคอมพิวเตอร์ด้าน machine learning และปัญญาประดิษฐ์ออกรายงานเวอร์ชั่น 1.0 โดยมีผู้เข้าร่วมน่าสนใจได้แก่ NVIDIA ที่ส่งเครื่อง DGX-A100 เข้าทดสอบ, อินเทลส่ง Xeon Platinum 8380, กูเกิลส่ง TPUv4 ที่ยังไม่เปิดให้บริการทั่วไป, และ Graphcore สตาร์ตอัพปัญญาประดิษฐ์ส่งเครื่อง IPU-POD เข้าจัดอันดับ
Zoom ประกาศกำลังอยู่ระหว่างเข้าซื้อ Karlsruhe Information Technology Solutions หรือ Kites GmbH สตาร์ทอัพทำระบบแปลภาษาเรียลไทม์ ในเยอรมนี แปลโดยใช้ Machine Learning ทางบริษัทไม่เปิดเผยมูลค่าดีล
HPE (Hewlett Packard Enterprise) ประกาศซื้อกิจการ Determined AI สตาร์ทอัพผู้พัฒนาแพลตฟอร์ม Machine Learning ที่มีจุดเด่นคือการเทรนโมเดล AI ได้รวดเร็วมากรองรับทุกสเกล มูลค่าของดีลดังกล่าวไม่มีการเปิดเผย
HPE บอกว่าจะนำโซลูชันของ Determined AI มารวมเข้ากับผลิตภัณฑ์ด้าน AI และ High Performance Computing (HPC) ในปัจจุบัน
Determined AI ก่อตั้งเมื่อปี 2017 และเปิดตัวแพลตฟอร์มแบบโอเพนซอร์สในปี 2020 มีลูกค้าระดับองค์กรในหลากหลายอุตสาหกรรม ดีลซื้อกิจการนี้เป็นดีลล่าสุดที่มีการรายงานอย่างเป็นทางการของ HPE นับตั้งแต่ปี 2019 ที่ซื้อ MapR
ภาคการศึกษากำลังเผชิญความท้าทายจากระบบการศึกษาที่พัฒนาและปรับเปลี่ยนหลักสูตรการสอนไม่ทันต่อเทรนด์โลก ผลิตคนไม่ตอบโจทย์อุตสาหกรรม และยังมีความท้าทายเรื่อง reskill ในสาขาอาชีพเสี่ยงตกงานตามความต้องการในตลาดแรงงาน เราจึงเห็นองค์กรใหญ่เข้าไปทำงานกับสถาบันการศึกษา เพื่อระบุทักษะสำคัญในโลกจริงแล้วนำไปปรับใช้ในการพัฒนาหลักสูตร เป็นการแก้ปัญหาที่ต้นเหตุ
KBTG ถือเป็นองค์กรที่ตื่นตัวในเรื่องนี้มาตลอด เห็นได้จากการทำโครงการ Tech Kampus เข้าไปร่วมพัฒนาหลักสูตรในและร่วมทำงานวิจัยกับมหาวิทยาลัย เตรียมความพร้อมนักศึกษาสู่ตลาดอุตสาหกรรมจริง รวมทั้งส่งเสริมวัฒนธรรมองค์กรให้พนักงานรีสกิลตัวเองอยู่เสมอ
Google Cloud ในฐานะผู้ให้บริการคลาวด์รายใหญ่ มีศูนย์ข้อมูลของตัวเอง และต้องใช้งานฮาร์ดดิสก์เป็นจำนวนมาก จับมือกับ Seagate พัฒนาเทคนิค machine learning เพื่อใช้พยากรณ์ว่าฮาร์ดดิสก์จะเสียหรือไม่
กูเกิลบอกว่ามีฮาร์ดดิสก์เป็นล้านๆ ตัว และมีข้อมูล metadata จำนวนมหาศาล เช่น SMART(Self-Monitoring, Analysis and Reporting Technology), Online Vendor Diagnostics (OVD), Field Accessible Reliability Metrics (FARM) ซึ่งไม่สามารถใช้มนุษย์อ่านได้อีกแล้ว จึงต้องใช้ machine learning มาช่วยอ่านข้อมูลแทน
นอกจาก Adobe จะปล่อย Photoshop สำหรับ Mac รันด้วย Apple M1 แล้ว ยังเพิ่มความสามารถใหม่ใน Adobe Camera Raw ส่วนเสริมสำหรับการตกแต่งรูปภาพใน Photoshop ซึ่งก็คือ Super Resolution ใช้ machine learning เพิ่มความละเอียดภาพแม้ซูมภาพใหญ่
ทีมวิจัยจากญี่ปุ่นนำเสนอปัญญาประดิษฐ์เฉพาะทางสำหรับแปลการ์ตูน (มังงะ - manga) โดยนำภาพในการ์ตูนเข้ามาประกอบเพื่อให้คุณภาพการแปลสูงขึ้น
กระบวนแปลภาษาในการ์ตูนนั้นมีความยากกว่าเนื้อหาปกติเพราะข้อความในแต่ละช่องของการ์ตูนมักเป็นข้อความสั้นๆ บางครั้งหากไม่มองเนื้อหาโดยรวมแล้วก็ถึงกับแปลไม่ได้ ทำให้ทีมวิจัยสร้างระบบการแปลแบบมองบริบทจากหลายมุมมอง (multimodal context-aware) โดยมองทั้งลำดับของภาพ, ลำดับของข้อความ, และบริบทผู้พูดข้อความนั้นๆ เช่น เพศของผู้พูด
ทีมงานระบุว่าระบบการแปลที่มองบริบทมาเป็นส่วนร่วมเช่นนี้น่าจะใช้งานประเภทอื่นๆ ได้ด้วย เช่น การทำคำบรรยายภาพยนตร์
แอปเปิลปล่อย TensorFlow 2.4 เวอร์ชัน fork ที่ปรับแต่งให้ทำงานได้ดีขึ้นบน Mac ทั้งรุ่นที่ใช้ซีพียูอินเทล และรุ่นที่ใช้ชิป M1 ทำให้นักพัฒนาสามารถดึงประสิทธิการทำงานของหน่วยประมวลที่สูงสุดระดับซีพียู 8 คอร์ และจีพียู 8 คอร์ ได้
แอปเปิลยังลงผลการทดสอบเปรียบเทียบเวลาที่ใช้ในการเทรนโมเดลแต่ละ batch โดยเทียบระหว่าง TensorFlow 2.3 เดิม และรุ่น fork บนเครื่องซีพียูอินเทล และ M1 พบว่าเวลาที่ใช้เร็วขึ้นถึง 7 เท่าเมื่อประมวลผลบน MacBook Pro จอ 13 นิ้ว ชิป M1
ผู้ใช้ Mac สามารถดาวน์โหลดได้ที่ GitHub โดยโครงการ TensorFlow กล่าวว่าในอนาคตจะนำเวอร์ชัน fork นี้มารวมกับ master branch ของโค้ดหลัก
ไมโครซอฟท์ปล่อยแอป Lobe เวอร์ชัน public preview ฟรีสำหรับผู้ใช้ Windows และ Mac ซึ่ง Lobe เป็นโปรแกรมสำหรับเทรนชุดข้อมูล เพื่อสร้างโมเดล Machine Learning โดยผู้ใช้งานไม่ต้องมีพื้นฐานด้านวิทยาศาสตร์ข้อมูล (Data Science) มาก่อน
Lobe เป็นสตาร์ทอัพที่พัฒนาแพลตฟอร์มสำหรับทำ Machine Learning ที่ง่ายกับผู้ใช้งาน ซึ่งไมโครซอฟท์ซื้อกิจการมาเมื่อปี 2018
Scribble เป็นหนึ่งในฟีเจอร์ใหม่ชูโรงของ iPadOS 14 ระบบปฏิบัติสำหรับบน iPad ซึ่งผู้ใช้งานสามารถใช้ Apple Pencil เขียนลายมือในช่อง input ของแอปหรือเว็บ และระบบจะแปลงเป็นตัวหนังสือให้ โดย Popular Mechanics ได้สัมภาษณ์ Craig Federighi รองประธานฝ่ายวิศวกรรมอาวุโสของแอปเปิล ทำให้เห็นแนวทางการออกแบบ Scribble ในการอ่านลายมือที่น่าสนใจ
YouTube ใช้ระบบอัตโนมัติและ ML ในการระบุวิดีโอไม่เหมาะสมอยู่แล้ว ล่าสุดประกาศจะขยายการใช้งาน ML ให้ช่วยเพิ่มการจำกัดอายุบนวิดีโอที่อาจไม่เหมาะสมกับเด็กและเยาวชนได้อัตโนมัติ
Google เผยข้อมูลเกี่ยวกับเทคโนโลยีเพิ่มคุณภาพเสียงสำหรับการสนทนาในบริการวิดีโอคอล Duo ในชื่อว่า WaveNetEQ โดยเบื้องหลังใช้เทคโนโลยี DeepMind ที่ช่วยให้ระบบจัดการกับเสียงขาด ๆ หาย ๆ ได้โดยที่ทำให้เสียงสนทนายังดูเป็นธรรมชาติ
สำหรับวิธีเพิ่มคุณภาพเสียงของ Duo คือระบบจะตรวจสอบว่าเสียงตรงไหนขาด ๆ หาย ๆ และจะแทนที่ส่วนนั้นด้วยเสียงสังเคราะห์ที่คล้ายกับคำพูดของคนที่สร้างจาก machine learning เพื่อทำให้ดูเหมือนจริง
Google ระบุว่า ปัจจุบันการโทรผ่าน Duo จะมี packet loss ถึง 99% โดย 20% ของทั้งหมดนี้จะมี packet loss มากกว่า 3% และ 10% ของทั้งหมดจะมี packet loss มากกว่า 8%
วันนี้ Google ได้ตีพิมพ์งานวิจัยล่าสุด ที่อ้างว่าสามารถสร้าง AI ที่ทำนายปริมาณฝนได้อย่างแม่นยำมากสุดถึง 6 ชั่วโมงล่วงหน้า ในระดับความละเอียด 1 กิโลเมตร โดยใช้เวลาประมวลผลเพียง 5-10 นาทีเท่านั้น
หากงานวิจัยนี้ถูกต้อง แปลว่า Google ได้สร้างเทคนิคการพยากรณ์อากาศแบบใหม่ ที่ทำงานเร็วกว่าเทคนิคที่ใช้กันอยู่ในปัจจุบันอย่างมหาศาล เพราะวิธีที่ดีที่สุดที่ใช้กันอยู่ทุกวันนี้ 2 วิธี ที่ชื่อ optical flow (OF) และ simulation forecasting ใช้ทั้งเวลา พลังงาน และ ข้อมูลในการประมวลผลมากกว่าวิธีของ Google หลายเท่า โดยกินเวลานานถึง 6 ชั่วโมงด้วยกัน
Jason Hickey หนึ่งในนักวิจัยเรื่องนี้ของ Google บอกว่า
Amazon SageMaker เป็นบริการเทรนโมเดล machine learning (ML) บนเครื่องของ AWS โดยรองรับเฟรมเวิร์คยอดนิยมอย่าง TensorFlow, Apache MXNet, PyTorch, Chainer, Scikit-learn, SparkML, Horovod, Keras, Gluon
ในงาน re:Invent 2019 ประจำปีนี้ AWS เพิ่มฟีเจอร์ให้ SageMaker สามารถไปรันบนคลัสเตอร์ Kubernetes ได้ง่ายขึ้นด้วย
AWS บอกว่าลูกค้าจำนวนมากของตัวเองรัน Kubernetes อยู่แล้ว แต่การนำงาน ML ไปรันบน Kubernetes ต้องปรับแต่งเองเยอะ (เช่น คอนฟิกให้ Kubernetes ทำงานกับ GPU ได้ดีขึ้น เพราะงาน ML ส่วนใหญ่มักรันบน GPU)