Ke Jie มือหนึ่งของวงการโกะโลก ให้สัมภาษณ์หลังแข่งแพ้ AlphaGo ในเกมแรก ว่าเขาไม่สามารถหาจุดอ่อนของ AlphaGo ได้เลย ถือเป็นความพ่ายแพ้อย่างสิ้นเชิง (เขาให้สัมภาษณ์ผ่านล่าม แต่ต้นทางแปลว่า a total defeat)
เขายังให้ความเห็นว่า AlphaGo รอบนี้แตกต่างไปจากของเดิมมาก หลังจากที่เคยประมือกันในศึกออนไลน์ตอนต้นปีนี้ และยกย่องว่า AlphaGo เปรียบได้กับ "พระเจ้า" แห่งการเล่นโกะเลยทีเดียว
Ke Jie ยังพยากรณ์ว่า AI จะล้ำหน้ามนุษย์ไปอีกมาก และไม่น่าจะมีมนุษย์คนใดสามารถเอาชนะ AI ได้ด้วยตัวเองเพียงลำพังอีกแล้ว
ดูไบวางแผนจะใช้ตำรวจหุ่นยนต์ หรือ Dubai Police Robot ทดแทนคน 25% ภายในปี 2030 ประชาชนสามารถเข้าไปติดต่อแจ้งความ สอบถามข้อมูลทั่วไป และถือเป็นการทดลองให้หุ่นยนต์สืบสวนคดีทั่วไปแทนคนด้วย อย่างไรก็ตาม หุ่นยนต์จะไม่มีสิทธิ์จับกุมคนและห้ามใช้ปืนอย่างเด็ดขาด
กระดานแรกระหว่าง AlphaGo และ Ke Jie กินเวลาสี่ชั่วโมงครึ่งได้จบลงแล้ว
AlphaGo ยังคงความได้เปรียบในแง่ของเวลา ใช้เวลาเพียงชั่วโมงกว่าๆ จาก 3 ชั่วโมงเท่านั้น ขณะที่ Ke Jie ใช้เวลาเกือบหมด แม้ว่าจะไม่หมดแบบ Lee Sedol ก็ตามที
เนื่องจาก Ke Jie เล่นเป็นหมากดำเมื่อรวมแต้มต่อแล้ว ทำให้คะแนนรวม AlphaGo ชนะไป 0.5 แต้ม
วันนี้เป็นวันแรกของงาน Future of Go Summit และเกมแรกระหว่าง AlphaGo และ Ke Jie ก็เริ่มแล้ว โดยสามารถดูสดได้ใน YouTube ท้ายข่าว
เกมระหว่าง AlphaGo และ Ke Jie เป็นเพียงหนึ่งในสามรูปแบบของการแข่งในงานนี้ โดยมีอีกสองแบบ คือ
ที่มา - Google Blog
ในคีย์โน้ตงาน Google I/O 2017 เมื่อสัปดาห์ที่ผ่านมา ธีมหลักของงานนั้นชัดเจนมากว่าเป็นเรื่องของ AI ที่มีความสำคัญเหนือทุกสิ่งอย่าง (Android และ VR ถูกนำไปพูดช่วงท้ายๆ และแทบไม่พูดถึงบริการตัวเก่าๆ อย่าง Google Maps หรือ Chrome เลย)
ซีอีโอ Sundar Pichai ขึ้นเวทีพร้อมกับย้ำว่าโลกกำลังเปลี่ยนผ่านจากยุค Mobile First มาเป็น AI First (เขาพูดเรื่องนี้มาตั้งแต่ปีที่แล้ว) พร้อมกับอธิบายผลงานด้าน AI ของกูเกิลในปัจจุบันว่ามีอะไรบ้าง
บทความนี้จะสรุปประเด็นและวิเคราะห์ผลงานด้าน AI ของกูเกิลว่าไปไกลแค่ไหน และเปรียบเทียบกับคู่แข่งแล้ว กูเกิลยืนอยู่ตรงไหนในโลกของ AI
งาน Future of Go Summit ปีนี้จะมีไฮไลท์ของงานคือการแข่งขันระหว่าง AlphaGo และ Ke Jie โดยรอบนี้จะเป็นการแข่งแบบ 3 กระดาน (ตอนแข่งกับ Lee Sedol แข่ง 5 กระดาน) โดยรอบนี้แต่ละฝ่ายจะมีเวลา 3 ชั่วโมง
ในงานจะเป็นงานสัมมนาด้านปัญญาประดิษฐ์ด้วย โดยมีผู้เชี่ยวชาญด้านปัญญาประดิษฐ์ของจีนเข้าร่วมงานจำนวนมาก แต่จะไม่มีการแข่งขันระหว่างปัญญาประดิษฐ์ของจีนที่พัฒนาโดย Tencent และ AlphaGo แต่อย่างใด
Google เปิดตัว Google for Jobs แพลตฟอร์มเสิร์ชค้นหางาน โดยร่วมมือกับบริษัทด้านโปรไฟล์และค้นหางานอย่าง LinkedIn, Monster, Facebook และ Glassdoor
Google for Jobs ไม่เพียงค้นหาตำแหน่งงานให้ผู้ใช้ แต่ยังใช้ Machine Learning ช่วยกรองตำแหน่งงานที่เหมาะสมกับผู้ใช้ รวมไปถึงความสะดวกในการเดินทาง พร้อมเปิด Google Jobs API ด้วย
ยังไม่มีข้อมูลว่า Google for Jobs เปิดให้ใช้งานที่ไหนและเมื่อไหร่ แต่อย่างน้อย Sundar Pichai ระบุว่ามีแผนจะเปิดให้ใช้งานทั่วโลก
ที่มา - ZDNet
กระบวนการพัฒนาเครือข่ายนิวรอนอย่าง deep learning นั้นต้องอาศัยผู้เชี่ยวชาญในระดับสูงเพื่อออกแบบเครือข่ายที่มีประสิทธิภาพดี สามารถทำงานตามที่ต้องการ (เช่น การจัดหมวดหมู่ภาพ) ได้อย่างแม่นยำ เครือข่ายเช่น GoogleNet อาศัยการออกแบบนานหลายปี ตอนนี้กูเกิลเสนอแนวทาง AutoML ใช้ machine learning เพื่อออกแบบเครือข่ายนิวรอน
แนวทาง AutoML กูเกิลจะสร้าง "ตัวควบคุม" (the controller) ออกแบบเครือข่ายนิวรอนขึ้นมาใหม่ จากนั้นนำเครือข่ายนิวรอนที่ออกแบบมาไปฝึกกับข้อมูลและตรวจสอบความแม่นยำกับข้อมูล จนกระทั่งได้เครือข่ายนิวรอนประสิทธิภาพสูง การพัฒนาเครือข่ายนิวรอนสำหรับชุดข้อมูล CIFAR-10 ของกูเกิลสามารถทำความแม่นยำได้ 94.6% เป็นความแม่นยำระดับเดียวกับงานวิจัยใหม่ๆ ในปี 2016 ที่ใช้เวลาพัฒนามายาวนาน
งาน Google I/O วันนี้ Google ประกาศเพิ่มฟีเจอร์ให้กับผู้ช่วยอัจฉริยะ Google Assistant ซึ่งคาบเกี่ยวกับฟีเจอร์บน Google Home ด้วย เลยขอเขียนเป็นข่าวเดียวไปเลยครับ
ส่วนของ Google Assistant หนึ่งในฟีเจอร์ใหม่ที่เพิ่มเข้ามานั้นมาพร้อมกับแอพ Google Lens ทำให้ผู้ใช้สามารถถาม, นัดหมายหรือสั่งจองตั๋วคอนเสิร์ตเพิ่มเติมได้ต่อเนื่องหลังสแกนรูปภาพ รวมไปถึงรองรับภาษาเพิ่มเติมอีก 5 ภาษาได้แก่ฝรั่งเศส, เยอรมนี, โปรตุเกส, บราซิลและญี่ปุ่นภายในหน้าร้อนนี้ ขณะที่ภายในสิ้นปีจะเพิ่มภาษาอิตาลี, สเปนและเกาหลีเข้ามาอีก
กูเกิลเปิดตัว Google Lens ฟีเจอร์ของ Google Assistant และ Google Photos ในการทำความเข้าใจภาพในระดับลึก ทำให้สามารถให้ข้อมูลสิ่งของในภาพได้มากกว่าเดิม
กูเกิลยังไม่ได้ระบุว่าฟีเจอร์ที่ Google Lens เข้าใจได้จะมีอะไรบ้าง แต่ในงาน Google I/O กูเกิลสาธิตฟีเจอร์ เช่น การแสดงข้อมูลพันธุ์พืช, ข้อมูลร้านอาหาร, หรือแม้แต่ข้อมูล Wi-Fi access point ที่สามารถเชื่อมต่อเครือข่ายได้โดยไม่ต้องพิมพ์รหัสเอง หรือแม้แต่แปลข้อความในภาพหากพบข้อความในภาษาอื่น
Google Lens สามารถเชื่อมต่อกับบริการอื่นๆ ของกูเกิลได้ในอนาคต แต่เร็วๆ นี้จะเพิ่มใน Assistant และ Photos ก่อน
ที่มา - @Google
กูเกิลเปิดตัว TPU (Tensor Processing Unit) ชิปสำหรับประมวลผล deep learning รุ่นที่สอง พัฒนาจากรุ่นแรกที่ใช้เพื่อการคำนวณผลลัพธ์จากเครือข่ายนิวรอนเป็นหลัก รุ่นใหม่นี้จะมีความสามารถในการฝึกเครือข่ายนิวรอน (inference) ได้ด้วย พร้อมกับเปิดบริการ Cloud TPU รุ่น Alpha (ต้องขอเข้าร่วมทดสอบ)
TPU แต่ละชุดจะมีพลังประมวลผล 180 TFLOPS กูเกิลออกแบบระบบเป็นตู้ (pod) แต่ละตู้มี TPU 64 ชุด รวมพลังประมวลผล 11.5 PFLOPS โค้ด TensorFlow สามารถรันบนเซิร์ฟเวอร์ได้โดยเปลี่ยนโค้ดเล็กน้อย
Cisco ประกาศเตรียมเข้าซื้อ MindMeld สตาร์ทอัพด้าน AI ด้วยมูลค่ากว่า 125 ล้านดอลลาร์
MindMeld นั้นมีผลงานด้านการสร้างอินเตอร์เฟสที่เกี่ยวกับการสนทนาโดยใช้ AI ซึ่งเทคโนโลยีและสิทธิบัตรของบริษัทนี้จะเน้นไปทางด้าน AI และ deep learning ซึ่งจะช่วยทำการปรับปรุง Cisco Spark และผลิตภัณฑ์อื่น ๆ ของ Cisco ได้
ปัจจุบัน MindMeld ยังมีแพลตฟอร์มสำหรับการสร้างบอทและผู้ช่วยส่วนตัวด้วยเสียง รวมถึงยังมี API ที่ปัจจุบันใช้โดยบริษัทกว่า 1,200 แห่งทั่วโลก โดยลูกค้าและนักลงทุนของบริษัทก็มี Google, Samsung, Intel, Telefonica, Liberty Global, IDG, USAA, Uniqlo, Spotify และ In-Q-Tel โครงการกองทุนของ CIA
NVIDIA เปิดตัวจีพียู Tesla รุ่นใหม่ในชื่อ V100 สำหรับงานดาต้าเซ็นเตอร์, AI แทน P100 เดิม ความน่าสนใจอยู่ที่ใช้จีพียูชื่อสถาปัตยกรรมใหม่ Volta ในรหัส GV100 ที่พร้อมผลิตเป็นการ์ดรุ่น GeForce ซีรีย์ 2000 ในลำดับต่อไป
สเปคที่น่าสนใจของ Tesla V100 อยู่ที่จำนวนทรานซิสเตอร์ขึ้นไปอยู่ที่ 21 พันล้านหน่วย (จากเดิม 15.3 พันล้านบน P100) ผลิตโดย TSMC ที่เทคโนโลยีระดับ 12nm FF (จากเดิม 16nm FF) มากับ CUDA Core 5,120 หน่วย ถูกหารเป็น 84 Volta Streaming Multiprocessor ทำงานกับแรม HBM2 16GB แบนด์วิดธ์ 900GB/s รีดพลังประมวลผลได้ 15 FP32 TFLOPS ยังไม่มีสเปคความร้อนหรือสัญญาณนาฬิกาออกมา ในรูปแบบการ์ด PCI-Express และ NVLINK ครับ (สเปคทรงพลังเกินกว่าจะเล่นเกมจริงๆ)
ในงาน Build 2017 วันแรกเมื่อคืนนี้ ไมโครซอฟท์ประกาศขยายความสามารถให้ Cortana เปิดให้นักพัฒนาภายนอกเข้ามาเชื่อมต่อได้ (สักที)
ฟีเจอร์นี้เรียกว่า Cortana Skills (ชื่อและแนวคิดเหมือนกับ Alexa Skills ของฝั่ง Amazon) สามารถใช้งานได้กับ Cortana ข้ามแพลตฟอร์ม ทั้งบน Windows 10, Android, iOS รวมถึง Cortana ที่ฝังอยู่บนฮาร์ดแวร์อย่างลำโพง Harman Kardon Invoke และในอนาคตจะมีฮาร์ดแวร์จาก HP กับ Intel ตามมา
ตัวอย่าง Skills ในตอนนี้ก็เช่น สั่งพิซซ่าจาก Domino's, ถามสูตรอาหารจาก Food Network เป็นต้น อย่างไรก็ตาม ฟีเจอร์ Skills ยังใช้งานได้เฉพาะในสหรัฐอเมริกาเท่านั้น
งาน Microsoft Build 2017 วันแรกเริ่มต้นด้วยคีย์โน้ตของ Satya Nadella ซีอีโอของไมโครซอฟท์ ขึ้นมาแสดงวิสัยทัศน์ใหม่ของไมโครซอฟท์ (next phase) ว่ากำลังเข้าสู่ช่วงเปลี่ยนผ่าน (paradigm shift) จาก Mobile First, Cloud First ไปสู่ Intelligent Cloud, Intelligent Edge ที่เน้นไปที่คลาวด์, ปัญญาประดิษฐ์และ IoT มากยิ่งขึ้น
Adobe เปิดตัวเครื่องมือวิเคราะห์ใหม่ Virtual Analyst เพื่อนำมาเสริมทัพ Analytics Cloud โดย Virtual Analyst นี้จะรันอยู่ในเบื้องหลังตลอดเวลาเพื่อตรวจจับข้อมูลและตรวจสอบหาสาเหตุของสิ่งผิดปกติของกิจกรรมออนไลน์ โดยจะนำมาใช้แทนที่การใช้วิศวกรหรือทีมงานที่เป็นคนทำการค้นหาข้อมูลที่ผิดปกติในข้อมูลจำนวนมาก
eMarketer บริษัทวิจัยตลาดคาดการณ์การใช้งานลำโพงอัจฉริยะที่สั่งงานด้วยเสียงในปีนี้ จะมีชาวอเมริกันใช้งานราว 35.6 ล้านคน เพิ่มขึ้นจากปีที่แล้ว 128.9% โดย Amazon Echo จะครองส่วนแบ่งตลาดมากที่สุดถึง 70.6% จากยอดผู้ใช้งานทั้งหมด
ส่วน Google Home ตามมาเป็นอันดับ 2 ที่ 23.8% ที่เหลือ 5.6% เป็นของเจ้าอื่นๆ รวมกัน อาทิ Lenovo, Harman Kardon, Mattel โดย eMarketer คาดว่าปีต่อไป ส่วนแบ่งของ Amazon Echo จะลดลงและไปเพิ่มให้กับ Google Home แทน แต่ก็ยังเป็นผู้นำตลาดอยู่เช่นเดิม
ทั้งนี้ eMarketer จัดหมวดหมู่ลำโพงอัจฉริยะแยกต่างหากจากกลุ่ม Virtual Assistance ซึ่ง eMarketer คาดว่าจะมีการใช้งานเพิ่มขึ้น 23.1% ในปีนี้
NVIDIA เปิดตัว NVIDIA Metropolis แพลตฟอร์มวิเคราะห์วิดีโอที่ประกอบจากสินค้าจำนวนมากของ NVIDIA เดิม ตั้งแต่บอร์ด Jetson สำหรับการประมวลผลที่ตัวกล้องวงจรปิด ไปจนถึงการ์ด Tesla บนเซิร์ฟเวอร์หรือบนคลาวด์ และซอฟต์แวร์ของ NVIDIA โดย Metropolis จะอยู่ภายใต้สถาปัตยกรรมเดียวกัน (unified architecture)
NVIDIA ไม่ได้บอกชัดเจนนักว่าความหมายของสถาปัตยกรรมเดียวกันนี้แปลว่าอะไร อาจจะแปลได้ตั้งแต่มีโครงสร้างชัดเจนถอดเปลี่ยนผู้ผลิตซอฟต์แวร์ส่วนต่างๆ ได้ ไปจนถึงแค่ว่าใช้สินค้าของ NVIDIA เป็นส่วนประกอบเหมือนๆ กัน
Facebook ทำปัญญาประดิษฐ์ช่วยการใช้งานใน Facebook Messenger มีชื่อเรียกว่า M ทำตามคำสั่งของผู้ใช้เช่นเรียกรถ โอนเงินให้เพื่อน เป็นต้น อย่างไรก็ตามผู้ใช้สามารถสั่งงาน M ได้ด้วยการพิมพ์เท่านั้น ไม่สามารถใช้คำสั่งเสียงเหมือน Alexa ของ Amazon และ Siri ของ Apple ได้
ทำไมถึงเป็นเช่นนั้น Stan Chudnovsky หัวหน้างานในส่วน Messenger มีคำตอบ
จากที่เคยมีข่าวปลายปีที่แล้วว่า Harman Kardon จับมือกับไมโครซอฟท์ทำลำโพงอัจฉริยะ โดยมี Cortana ทำงานอยู่เบื้องหลัง วันนี้ Invoke คู่แข่ง Amazon Echo และ Google Home ได้ถูกเผยโฉมออกมาบนหน้าเว็บไซต์แล้ว
ถึงแม้ Harman Kardon จะเอาหน้าเว็บที่มีรายละเอียด Invoke ลง แต่จากข้อมูลที่ขึ้นก่อนหน้านี้ ตัว Invoke มีลักษณะทรงกระบอกสูงแบบเดียวกับ Amazon Echo และรองรับคำสั่งเสียงในการสั่งงานไม่แตกต่างจากทั้ง Echo และ Google Home มีสองสีคือสีเงินและสีดำ โดย Harman Kardon ระบุว่าจะวางขายภายในปลายปีนี้ (coming fall 2017) และไม่มีการระบุราคาครับ
Google Cloud Natural Language API ประกาศเพิ่มความสามารถ จากเดิมที่ใช้งานได้เฉพาะภาษาอังกฤษ, สเปน, และญี่ปุ่น ตอนนี้ภาษาเพิ่มขึ้นอีกจำนวนมาก โดยภาษาแถบเอเชียที่รองรับเพิ่มคือจีนและเกาหลี ที่เหลือได้แก่ ฝรั่งเศส, เยอรมัน, อิตาลี, และโปรตุเกส
นอกจากการรองรับภาษาเพิ่มเติม API เวอร์ชั่นใหม่ยังเพิ่มฟีเจอร์การวิเคราะห์อารมณ์ของภาษา (sentiment) เฉพาะส่วนของข้อความ จากเดิมที่การวิเคราะห์ข้อความที่มีอารมณ์ขัดแย้งอาจจะสับสน เช่น "โทรศัพท์เครื่องนี้ดีแต่แบตเตอรี่ไม่ทน" ในเวอร์ชั่นใหม่จะสามารถแยกอารมณ์ออกเป็นสองส่วน และบอกได้ว่าเมื่อพูดถึงโทรศัพท์จะเป็นด้านดี แต่พูดถึงแบตเตอรี่ในด้านแย่
การสร้างท่าทางเคลื่อนไหวของตัวละครในเกมเป็นงานสำคัญของการพัฒนาเกมที่ต้องอาศัยการบันทึกท่าทางจากนักแสดงไว้ล่วงหน้าที่มีต้นทุนสูง หรือมีเทคนิคการสร้างท่าทางเคลื่อนไหวจากการประมาณการท่าเคลื่อนไหวอื่นๆ ล่าสุดงานวิจัยจากมหาวิทยาลัย Edinburgh อาศัยเครือข่ายนิวรอนเพื่อการสร้างท่าเคลื่อนไหวได้อย่างสมจริง
Phase-Functioned Neural Networks เป็นเครือข่ายนิวรอนที่มี Phase-Function เข้าควบคุมน้ำหนักระหว่างนิวรอน
ความได้เปรียบหลักของการสร้างท่าทางเคลื่อนไหวด้วยเทคนิคใหม่นี้คือมันใช้หน่วยความจำเพียงประมาณ 10 เมกกะไบต์ และไม่กินเวลาประมวลผลมากนัก ขณะที่ได้ท่าทางเคลื่อนไหวเป็นธรรมชาติ การใช้งานในเกมจริงๆ จึงเป็นไปได้ในอนาคตอันใกล้นี้
ก้าวไปข้างหน้าอีกก้าวแล้วสำหรับรัฐบาลสิงคโปร์ เมื่อรัฐมนตรีกระทรวงข้อมูลและการสื่อสารของสิงคโปร์ ประกาศโครงการ AI.SG ของรัฐบาล นำโดย National Research Foundation ในการผลักดันและร่วมมือกันในด้านการวิจัย พัฒนาและการใช้งานปัญญาประดิษฐ์ ตั้งแต่ภาครัฐ เอกชนไปจนถึงสตาร์ทอัพ ในทุกๆ อุตสาหกรรม
รัฐมนตรีกระทรวงข้อมูลและการสื่อสารระบุว่าตอนนี้โปรเจ็คนี้มีเป้าหมายอยู่ 3 อย่าง
มูลนิธิกระจกเงาประสบความสำเร็จในการตามหาบ้านของคนหาย (กลับข้างกับการตามหาคนหายตามปกติ) โดยเป็นการตามหาบ้านของนายอั้มที่หนีออกจากบ้านตั้งแต่อายุเพียง 7-8 ขวบ และออกจากบ้านไปถึง 15 ปี ด้วยความไม่ได้เรียนหนังสือจึงไม่สามารถอ่านเขียนได้ แต่สามารถใช้คอมพิวเตอร์ได้เพราะเล่นเกมออนไลน์
Brian Chin ผู้บริหารของธนาคารสัญชาติสวิส Credit Suisse เผยว่าตอนนี้ทางธนาคารได้เริ่มนำหุ่นยนต์ 20 ตัวมาใช้ภายในบริษัท โดยมีส่วนหนึ่งช่วยพนักงานในการตอบคำถามอย่างง่าย ๆ เพื่อช่วยลดจำนวนสายโทรศัพท์ที่เข้ามายังคอลเซ็นเตอร์ของธนาคารได้สูงสุดถึง 50%
หุ่นยนต์เหล่านี้ Chin บอกว่าจะเอาไว้ใช้ตอบคำถามอย่างง่าย ๆ ผู้ใช้เพียงถามคำถาม และหุ่นยนต์ก็จะตอบคำตอบที่เหมาะสมมาให้ โดยไม่จำเป็นต้องไปเปิดคู่มือหรือเว็บไซต์ ซึ่งมันใช้งานได้ดีมากในการถามคำถามทั่วไป
เทคโนโลยีดังกล่าวนั้นคล้ายกับ Amazon Alexa ซึ่งแม้ว่า Chin จะเรียกเทคโนโลยีเหล่านี้ว่าหุ่นยนต์ แต่ก็ไม่มีข้อมูลแน่ชัดว่าอุปกรณ์ดังกล่าวนั้นมีตัวตนจริงหรือไม่ หรือพนักงานโต้ตอบกับตัวอุปกรณ์อย่างไร