Amazon SageMaker เป็นบริการเทรนโมเดล machine learning (ML) บนเครื่องของ AWS โดยรองรับเฟรมเวิร์คยอดนิยมอย่าง TensorFlow, Apache MXNet, PyTorch, Chainer, Scikit-learn, SparkML, Horovod, Keras, Gluon
ในงาน re:Invent 2019 ประจำปีนี้ AWS เพิ่มฟีเจอร์ให้ SageMaker สามารถไปรันบนคลัสเตอร์ Kubernetes ได้ง่ายขึ้นด้วย
AWS บอกว่าลูกค้าจำนวนมากของตัวเองรัน Kubernetes อยู่แล้ว แต่การนำงาน ML ไปรันบน Kubernetes ต้องปรับแต่งเองเยอะ (เช่น คอนฟิกให้ Kubernetes ทำงานกับ GPU ได้ดีขึ้น เพราะงาน ML ส่วนใหญ่มักรันบน GPU)
Alibaba Cloud ธุรกิจฝั่งองค์กรของ Alibaba ปล่อยไลบรารี Alink ที่เป็นไลบรารีคอมพิวเตอร์เรียนรู้ได้ (machine learning) ชุดใหญ่ สำหรับการสร้างบริการในกลุ่มคอมพิวเตอร์เรียนรู้ได้ เช่น ระบบแนะนำสินค้า, การทำนายข้อมูลในอนาคต
ไลบรารีประกอบด้วยกลุ่มอัลกอริทึม เช่น จัดหมวดหมู่ข้อมูล (classification), ทำนายข้อมูล (regression), จับกลุ่มข้อมูล (clustering), หาชุดข้อมูลผิดปกติ, การคำนวณค่าสถิติ โดยรวมนับว่าใกล้เคียงกับโครงการ scikit-learn แต่ Alink ออกแบบมาเพื่อใช้งานกับ Apache Flink เป็นหลัก แม้จะมีโมดูล PyAlink ให้ทำงานกับไพธอนด้วยก็ตาม
ทีมวิศวกรด้าน AI ของ Facebook ได้เขียนบล็อกอธิบายเบื้องหลังการทำงานของส่วน Explore ใน Instagram ที่จะแนะนำโพสต์ที่ผู้ใช้งานแต่ละคนน่าจะสนใจ โดยมีประเด็นสำคัญหลายอย่าง
กระบวนการคัดเลือกโพสต์เพื่อมานำเสนอใน Explore แต่ละคนนั้น Facebook เรียกว่าผ่านตัวกรอง 3 ระดับ เริ่มต้นจากการนำโพสต์จำนวนหลายพันล้านโพสต์ มาจำแนกผ่านโมเดลมากกว่า 90 ล้านตัวแบบ โดยคัดเลือกโพสต์ที่ดีและเป็นเนื้อหาใหม่
หน่วยวิจัย AI ของ Facebook ประกาศความสำเร็จในการสร้างระบบ de-identification สำหรับบุคคลในวิดีโอได้แล้ว สามารถใช้งานกับวิดีโอได้แบบบเรียลไทม์รวมถึงการไลฟ์ด้วย โดยไม่ต้องผ่านการเทรนใหม่ทุกครั้งที่จะใช้งาน และใช้เวลาในการปรับแต่งวิดีโอเพียงเล็กน้อยเท่านั้น
ปัญหาของระบบรู้จำใบหน้าคือทำให้ผู้ใช้งานสูญเสียความเป็นส่วนตัว และเทคโนโลยีทดแทนใบหน้าที่นับวันยิ่งเก่งขึ้นเรื่อย ๆ อาจะถูกใช้เพื่อสร้างวิดีโอที่ชี้นำในทางที่ผิด เป็นไอเดียตั้งต้นที่ทำให้เกิดงานวิจัยชิ้นนี้ขึ้นมา
ตัว AI นี้ จะใช้ระบบ encoder-decoder เพื่อสร้างหน้ากากและภาพ โดยในระหว่างการเทรนนิ่ง จะใช้หน้าคนที่ปรับแต่งแล้วส่งเข้าไปในระบบ และระบบจะสร้างหน้าแบบบิดเบี้ยวและไม่บิดเบี้ยวของคนออกมา สามารถนำไปใช้งานในวิดีโอได้
หลายคนคงเคยใช้ระบบควบคุมความเร็วอัตโนมัติ หรือ cruise control ในรถยนต์ ซึ่งก็พัฒนาต่อมาเป็นระบบควบคุมความเร็วอัตโนมัติแบบแปรผัน หรือ adaptive cruise control ซึ่งรถสามารถชะลอความเร็วตามรถคันข้างหน้าได้ โดยที่ผู้ขับต้องกำหนดว่าจะให้รถเราห่างจากรถคันข้างหน้าแค่ไหน ซึ่งก็ถือว่าสะดวกขึ้นจากแบบเดิมมาก
อย่างไรก็ตาม Hyundai ระบุว่าเจ้าของรถจะรู้สึกกระอักกระอ่วนเมื่อใช้ระบบ adaptive cruise control เพราะรถจะขับไม่เหมือนที่ตนเคยชิน อาจจะมีจังหวะเร่งหรือเบรคที่ต่างออกไป
กูเกิลประกาศฟีเจอร์ใหม่ใน Google Chrome ใช้ machine learning ระบุคำอธิบายรูปภาพ เพื่อให้คนพิการทางสายตาสามารถเข้าถึงเนื้อหารูปภาพได้ดียิ่งขึ้น
กูเกิลระบุว่า บนเว็บไซต์ต่างๆ ยังมีรูปภาพอีกเยอะที่ไม่ได้ระบุคำอธิบาย และผู้พิการทางสายตาที่ใช้จออักษรเบรลล์ หรือ Braille display ในการท่องเว็บก็ยังมีอุปสรรคในจุดนี้ กูเกิลจึงเพิ่มความสามารถใช้ machine learning ระบุคำอธิบายรูปภาพ บน Google Chrome
กูเกิลเขียนบล็อกรีวิวงานวิจัยปัญญาประดิษฐ์ในกลุ่มการแปลภาษาอัตโนมัติที่รองรับภาษาจำนวนมาก (massively multilingual, massive neural machine translation - M4) ที่กูเกิลพยายามพัฒนาอย่างหนักในช่วงหลัง เนื่องจากภาษาบางภาษานั้นมีข้อมูลจำนวนน้อย ทำให้การพัฒนาซอฟต์แวร์แปลภาษาอัตโนมัตินั้นได้คุณภาพไม่ดีนัก
ตัวอย่างเช่นการแปลภาษาฝรั่งเศส, ภาษาเยอรมัน, หรือภาษาสเปนนั้นมีตัวอย่างนับพันล้านรายการต่อภาษา แต่ที่มีตัวอย่างน้อย เช่น ภาษาฮาวาย กลับมีข้อมูลเพียงระดับหมื่นรายการเท่านั้น
สรุปความจากการบรรยายหัวข้อ MLOps: Productionizing Machine Learning at Scale โดยคุณทัศพล อธิอภิญญา Advanced Machine Learning Engineer จากบริษัท กสิกร บิสซิเนส-เทคโนโลยี กรุ๊ป หรือ KBTG
คุณทัศพลเคยเป็นวิศวกรคนไทยในสหรัฐอเมริกามาก่อน เคยทำงานกับ HortonWorks, VMware และร่วมทีม Siri ใน Apple ที่สำนักงานใหญ่ (อ่านบทสัมภาษณ์คุณทัศพล สมัยทำงานที่ HortonWorks)
ฝ่ายวิจัย AI ของ Facebook ได้โอเพ่นซอร์ส Pythia เฟรมเวิร์คแบบ plug-and-play สำหรับนักวิทยาการข้อมูลเพื่อการสร้าง, ทำสำเนา และวัด benchmark ของ AI model โดยเฟรมเวิร์คนี้พัฒนาบน PyTorch อีกชั้นหนึ่ง
Facebook ระบุว่า Pythia รองรับ distributed training และดาต้าเซ็ทหลายแบบ รวมถึง custom loss, metrics, scheduling และ optimizers แบบปรับแต่งเอง ซึ่งตัวเฟรมเวิร์คออกแบบมาให้เหมาะกับงานประเภท vision และงานด้านภาษา เช่น การสร้างแคปชั่นของภาพ เป็นต้น
ปีที่แล้วเราเห็น กูเกิลเปิดคอร์สวิชา Machine Learning ที่ใช้สอนพนักงาน ให้คนทั่วไปเรียนฟรีออนไลน์ ออกมาหลายคอร์ส และได้รับความนิยมอย่างมาก
ปีนี้กูเกิลเปิดคอร์ส Machine Learning ชั้นสูง เจาะลึกในด้านต่างๆ เพิ่มมาอีก 3 คอร์ส ได้แก่
ทุกวันนี้คำว่า DevOps (development + operations) ได้รับความนิยมในวงกว้างมากขึ้น ในวงการ AI เองก็มีคำว่า MLOps (machine learning + operations) ที่เริ่มเป็นที่รู้จักเช่นกัน
สัปดาห์ที่แล้ว ไมโครซอฟท์ประกาศฟีเจอร์ใหม่ของ Azure Machine Learning โดยเน้นที่กระบวนการเทรนโมเดลให้อัตโนมัติมากขึ้น
ฟีเจอร์สำคัญคือการผนวกเอา Azure DevOps โดยเฉพาะด้าน CI/CD มาใช้กับงาน machine learning ด้วย เพื่อให้ตลอดอายุงาน (machine learning lifecycle) ทำงานต่อเนื่อง ตั้งแต่การสร้างโมเดล พิสูจน์การทำงานของโมเดล ดีพลอย และการเทรนซ้ำ
Wikimedia Foundation องค์กรผู้ดูแลเว็บไซต์สารานุกรมเสรี Wikipedia ได้ระบุถึงการนำ machine learning มาใช้เพื่อประโยชน์ในการทำระบบการอ้างอิงของ Wikipedia
Wikimedia ระบุว่า กลไกสำคัญที่ทำให้ Wikipedia รักษาคุณภาพระดับสูงเอาไว้ได้นั่นก็คือ inline citation หรือการอ้างอิงในเนื้อหา ซึ่งการอ้างอิงเหล่านี้จะทำให้ผู้อ้างและผู้แก้ไขมั่นใจว่าข้อความในบทความนั้น ๆ สะท้อนแหล่งข้อความอย่างเที่ยงตรง ส่วนเนื้อหาอะไรที่ไม่มีแหล่งข้อมูลชัดเจน จะต้องถูกลบหรือมีการแปะว่า “ต้องการอ้างอิง”
วันนี้ Google ประกาศปล่อย API เพิ่มเติมให้ ML Kit ชุดพัฒนาด้าน machine learning สำหรับการพัฒนาแอปบน iOS และ Android สองอย่าง คือ Smart Reply และ Language Identification ซึ่งเป็นการเพิ่มฟีเจอร์ด้านการประมวลผลภาษาธรรมชาติหรือ NLP เข้ามา หลังจากที่ก่อนหน้านี้ชุด ML Kit จะเน้นด้านการประมวลผลภาพและวิดีโอเป็นหลัก
ฟีเจอร์แรก Smart Reply API จะเป็นฟีเจอร์คล้ายกับ Smart Reply ของ Gmail คือระบบแนะนำคำตอบ ใช้งานได้ทั้งในตัวแอปและการแจ้งเตือนที่ปรากฏขึ้นมา เพื่อให้ผู้ใช้ตอบกลับได้อย่างรวดเร็วตอนที่ไม่สะดวกเขียนข้อความตอบกลับยาว ๆ
มีรายงานว่าแอปเปิลได้เข้าซื้อกิจการ Laserlike สตาร์ทอัพรายเล็กที่พัฒนาเทคโนโลยีด้าน Machine Learning โดยดีลดังกล่าวสิ้นสุดตั้งแต่ปลายปีที่แล้ว แต่เพิ่งมีรายงานออกมา และไม่มีการเปิดเผยมูลค่า
Laserlike พัฒนา Machine Learning โดยทำการกวาดข้อมูลจากเว็บไซต์ต่าง ๆ แล้วนำมาคัดเลือกเนื้อหาให้สำหรับผู้ใช้แต่ละคนผ่านตัวแอป โดยผู้ใช้ระบุสิ่งที่สนใจ ก็จะได้รับข้อมูลที่เกี่ยวข้องแต่ละวัน ตลอดจนมีการแนะนำเว็บไซต์น่าสนใจอิงจากข้อมูลการเข้าชมเว็บของแต่ละคน
รายงานระบุว่าทีมงานของ Laserlike ตอนนี้ทำงานอยู่ในทีมของ Siri จึงคาดว่าแอปเปิลจะนำเทคโนโลยีนี้มาใช้ในการค้นหาหรือแนะนำข้อมูลให้เหมาะสมกับแต่ละคนมากขึ้น เมื่อมีการส่งคำถามไปยัง Siri นั่นเอง
ทีม AI ของ Google เขียนบล็อคเผยว่าระบบ speech recognition ใน GBoard (พูดแล้วแปลงเป็นคำ) บน Google Pixel จะรองรับการประมวลผลในเครื่องแทนที่จะประมวลผลจากเซิร์ฟเวอร์ในแบบเดิม ช่วยลด latency ในการประมวลผลเสียงเป็นคำลง รวมถึงสามารถใช้ได้แบบออฟไลน์ด้วย
การเปลี่ยนแปลงนี้เกิดขึ้นได้ ส่วนหนึ่งก็จากบน Pixel 2 และ 3 มี Pixel Visual Core ที่รองรับการประมวลผล ML ในเครื่องเลย อีกส่วนคือการเปลี่ยนแปลงโมเดลของระบบ speech recognition จากเดิมที่เป็นแบบ sequence-to-sequence ประมวลผลเสียงพูดออกมาเป็นคำหรือประโยค ซึ่งกระบวนการนี้มีข้อจำกัดเรื่องความหน่วง ไม่รองรับการประมวลผลทั้งขา input (พูด) และ output (แสดงคำ/ประโยค) ในเวลาเดียวกัน
วันนี้ นอกจาก TensorFlow 2.0 Alpha แล้ว Google ก็ได้เปิดตัวไลบรารี TensorFlow อีกตัวหนึ่งด้วยในชื่อว่า TensorFlow Privacy ซึ่งวางตำแหน่งเป็นไลบรารีสำหรับงานด้าน machine learning ที่ต้องการันตีความเป็นส่วนตัว
Google ระบุว่า TensorFlow Privacy เกิดขึ้นมาเนื่องจาก machine learning ในยุคนี้ถูกประยุกต์ใช้กับเทคโนโลยีและประสบการณ์ผู้ใช้ใหม่ ๆ เสมอ ซึ่งหลายครั้งจะต้องเทรนข้อมูลสำคัญอย่างเช่นรูปถ่ายส่วนตัวหรืออีเมล Google จึงเปิดตัว TensorFlow Privacy ที่มีเทคนิค machine learning แบบเน้นความเป็นส่วนตัวมาก ๆ มาให้ใช้งาน
DeepMind แถลงผลการทดลองใช้ระบบคอมพิวเตอร์เรียนรู้ได้ (machine learning) มาจัดการพลังงานลมจากฟาร์มที่กูเกิลเข้าไปมีส่วนร่วม โดยปัญหาสำคัญของพลังงานลมคือมันขึ้นกับสภาพอากาศอย่างมาก ทำให้การทำนายพลังงานที่ได้รับโดยรวมทำได้ยาก แหล่งพลังงานที่ใส่ไฟฟ้าเข้าไปในระบบกริดโดยบอกล่วงหน้าได้ จะได้มูลค่าสูงกว่า
ทาง DeepMind สร้างโมเดล machine learning เรียนรู้จากข้อมูลพยากรณ์อากาศแล้วนำมาพยากรณ์ปริมาณไฟฟ้าที่จะผลิตได้ล่วงหน้า 36 ชั่วโมง ทำให้ฟาร์มลมเหล่านี้สามารถสัญญาส่งพลังงานล่วงหน้าเข้ากริดล่วงหน้าหนึ่งวันเต็ม การจัดการระบบกริดสามารถทำได้ดีขึ้น
รายงานระบุว่าการทำนายข้อมูลต่างๆ ให้ดีขึ้น ทำให้มูลค่าของพลังงานลมที่ได้จากฟาร์มเหล่านี้สูงขึ้นถึง 20%
Gmail มีระบบกรองสแปมมานานแล้ว กูเกิลบอกว่าสามารถกรองได้ 99.9% แต่ระบบกรองใหม่ล่าสุดที่ใช้พลังของ TensorFlow ก็ช่วยกรองสแปมได้แม่นยำกว่าเดิม กูเกิลไม่ได้บอกว่าเพิ่มเป็นกี่เปอร์เซ็นต์ แต่บอกว่ากรองได้เพิ่มอีกวันละ 100 ล้านฉบับ
กูเกิลอธิบายว่าการใช้ TensorFlow ช่วยป้องกันสแปมในกรณีที่ตรวจจับได้ยาก เช่น เป็นอีเมลที่แนบไฟล์รูป ฝังเนื้อหาที่มองไม่เห็นมาด้วย หรือเป็นอีเมลที่ส่งจากโดเมนใหม่ที่ยังไม่เคยมีประวัติการส่งสแปมมาก่อน ดังนั้นการใช้เทคนิค machine learning ให้เรียนรู้แพทเทิร์นของอีเมลแบบนี้ จะช่วยป้องกันสแปมในกรณีเหล่านี้ได้แม่นยำขึ้น
ที่มา - Google
มีข้อมูลใหม่เกี่ยวกับ Project Maven ซอฟต์แวร์วิเคราะห์ภาพถ่ายจากโดรนที่ Google ร่วมมือกับกองทัพสหรัฐฯว่า ในการฝึกระบบให้สามารถแยกแยะความแตกต่างของวัตถุในรูปถ่ายนั้น ทาง Google ได้จ้างคนจาก Figure Eight ซึ่งเป็นแพลตฟอร์มสำหรับจ้างคนไปทำงานเล็กๆ น้อยๆ
ในอีเมลข้อมูลที่เว็บไซต์ The Intercept ได้มานั้นระบุว่าหลังจากที่ Google ลงนามข้อตกลงกับกองทัพ Google ก็เริ่มทำ label data หรือการระบุชื่อประเภทข้อมูลจากภาพถ่ายดาวเทียม และในเดือนตุลาคม 2017 ก็ได้ส่งงานให้บริษัท CrowdFlower ซึ่งต่อมาภายหลังเปลี่ยนชื่อเป็น Figure Eight รับงานไปทำต่อ ซึ่งเป็นงานละเอียดและต้องอยู่กับข้อมูลจำนวนมาก
GitHub รายงานข้อมูลสถิติ contributions บนแพลตฟอร์มประจำปีที่แล้ว โดยเน้นที่ด้าน machine lerning และ data science ว่าตอนนี้ผู้ใช้งานสนใจโปรเจคไหน และภาษาอะไรบ้าง โดยสถิติเรื่องการ contribution จะมีตั้งแต่การพุชโค้ด, เปิด issue หรือ pull request, คอมเมนท์บน issue หรือ pull request และรีวิวตัว pull request
หลังจากที่ทำการเก็บข้อมูลและนำมาทำการวิเคราะห์แล้ว GitHub สรุปเป็นหัวข้อใหญ่ ๆ ดังนี้
หัวข้อแรก คือภาษาที่นิยมใช้ในงานด้าน machine learning บน GitHub ซึ่งใช้วิธีการเก็บข้อมูลจาก repositories ที่แท็กว่า machine-learning และจัดอันดับตามภาษาหลักที่ใช้ใน respositories เป็นสิบอันดับแรกคือ Python, C++, JavaScript, Java, C#, Julia, Shell, R, TypeScript และ Scala
AWS เปิดตัว Neo-AI โครงการโอเพ่นซอร์สใหม่ที่พัฒนาเครื่องมือสำหรับการ optimize โมเดล machine learning เพื่อการดีพลอยบนแพลตฟอร์มที่หลากหลายโดยเฉพาะการรันบน edge device ซึ่ง AWS ใช้เทคโนโลยีที่ทางบริษัทพัฒนา SageMaker Neo บริการ machine learning บน AWS มาพัฒนา Neo-AI นี้ด้วย
Neo-AI สามารถใช้โมเดลจาก TensorFlow, MXNet, PyTorch, ONNX และ XGBoost จากนั้นก็ทำการ optimize ได้ ซึ่ง AWS ระบุว่า Neo-AI สามารถทำให้โมเดลเร็วขึ้นกว่าเดิมได้สูงสุดถึง 2 เท่าโดยไม่เสียความแม่นยำ ซึ่งตัวเครื่องมือนี้รองรับฮาร์ดแวร์ชิพจากทั้ง Intel, Nvidia และ ARM ซึ่งจะซัพพอร์ต Xilinx, Cadence และ Qualcomm ในอนาคตด้วย
Google Cloud เปิดตัว Feast เครื่องมือเก็บฟีเจอร์แบบโอเพ่นซอร์สเพื่อการจัดการ, เก็บ และค้นพบฟีเจอร์สำหรับการใช้ในโปรเจค machine learning โดย Google ระบุว่าเป็นผลงานการพัฒนาร่วมกันระหว่างทีมจาก Go-Jek แอพเรียกรถจากอินโดนีเซียและ Google Cloud
การพัฒนา Feast เพื่อเป็นเครื่องมือเก็บฟีเจอร์นี้ เนื่องจากเป็นงานที่ท้าทายสำหรับทีมวิศวกรด้าน machine learning ที่จะต้องพัฒนาแพลตฟอร์มเพื่อการเก็บฟีเจอร์เป็นแพลตฟอร์มเดียวที่จะต้องยืดหยุ่นเพียงพอ คือทีมสามารถนำฟีเจอร์ลงไปเก็บ และนำไปใช้กับโปรเจค machine learning อื่น ๆ ได้ด้วย
ระบบรีวิวบน Google Play นั้นมักจะมีผลต่อการตัดสินใจติดตั้งแอพของผู้ใช้มาก แต่ทุกวันนี้มีปัญหารีวิวขยะเกิดขึ้นมาก เนื่องจากนักพัฒนาบางรายใช้วิธีซื้อรีวิวเพื่อทำให้แอพของตัวเองดูดีขึ้น ซึ่ง Google ก็รับทราบปัญหานี้ดี และพยายามที่จะหาวิธีกำจัดเนื่องจากเป็นปัญหาที่กระทบต่อความเชื่อมั่นของผู้ใช้
เรตติ้งและรีวิวที่ถูกจัดว่าผิดกฎของ Google Play จะมีลักษณะสามอย่างหลัก ๆ คือ
ที่งาน AWS re:Invent 2018 Amazon ได้เปิดตัวบริการ Amazon Elastic Inference ที่ทำให้สามารถเพิ่ม GPU ไปยังเครื่อง EC2 ประเภทใดๆ ก็ได้
เดิมทีการใช้งาน GPU ใน EC2 นั้นจะต้องเลือกใช้เครื่องประเภทที่มี GPU ในตัวเท่านั้น เช่นประเภท P3 ซึ่งบางครั้งผู้ใช้งานอาจจะต้องการใช้เพียงแค่ GPU แต่ไม่ได้ต้องการ CPU หรือ Memory จำนวนมาก โดยเฉพาะงานประเภทหาคำตอบจากโมเดลที่สำเร็จแล้ว (inference) การใช้งานลักษณะนี้จึงสิ้นเปลืองค่าใช้จ่ายมาก
Elastic Inference จะทำให้เราสามารถเพิ่ม GPU ไปยังเครื่อง EC2 ประเภทใดๆ ก็ได้ (คล้ายๆ กับของ Google Cloud) หรือต่อกับ SageMaker รองรับการใช้งานผ่านทั้ง TensorFlow และ Apache MXNet
Amazon ประกาศเพิ่มฟีเจอร์ใหม่ให้ AWS Marketplace บริการร้านค้าซอฟต์แวร์บน AWS โดยฟีเจอร์แรกคือนำอัลกอริทึมและโมเดลของ machine learning มาขายผ่าน Marketplace และ Private Marketplace หรือ Marketplace ที่ใช้กันเฉพาะภายในองค์กร
ฟีเจอร์แรกคือ machine learning โดย AWS ระบุว่าใน Marketplace จะเพิ่มหมวดหมู่ใหม่คือ machine learning ซึ่งจะรวมอัลกอริทึมและโมเดลจากหลาย ๆ บริษัท และครอบคลุมความต้องการในหลาย ๆ ด้าน ซึ่งเมื่อผู้ใช้พบสิ่งที่ต้องการจาก Marketplace แล้ว สามารถดีพลอยโดยตรงจากคอนโซลของ SageMaker, Jupyter Notebook, SageMaker SDK หรือ AWS CLI ก็ได้