Tags:
Node Thumbnail

Scale กลายเป็นสตาร์ทอัพล่าสุดที่ถูกจับตามอง เนื่องจากบริษัทได้ประกาศเพิ่มทุนซีรี่ส์ C อีก 100 ล้านดอลลาร์ ทำให้มูลค่ากิจการทะลุ 1 พันล้านดอลลาร์ มีสถานะเป็นสตาร์ทอัพยูนิคอร์นเป็นที่เรียบร้อย โดยนักลงทุนรอบนี้มีทั้ง Accel, Coatue Management, Index Ventures, Spark Capital, Thrive Capital และนักลงทุนอิสระได้แก่ Kevin Systrom, Mike Krieger (สองผู้ก่อตั้ง Instagram) และ Adam d’Angelo (ซีอีโอ Quora)

ผลิตภัณฑ์หลักของ Scale คือซอฟต์แวร์ที่ช่วยลดขั้นตอนการเทรนข้อมูลสำหรับองค์กรที่พัฒนา AI โดยจะช่วยใส่ข้อมูลกำกับภาพ (annotate) ว่าเป็นวัตถุอะไรก่อน ลูกค้าของ Scale จึงมีหลายบริษัทด้านการพัฒนารถยนต์ไร้คนขับ อาทิ Waymo, Cruise ของ GM, Uber ไปจนถึงบริษัทอย่าง OpenAI และ Airbnb

Tags:
Node Thumbnail

Google Assistant รองรับการอ่านและตอบข้อความด้วยเสียงมานานแล้วแต่จำกัดเฉพาะบน Android Message หรือ Hangout เป็นหลักเท่านั้น ล่าสุดฟีเจอร์นี้รองรับแอปแชทแห่งยุคอย่าง Telgram, Slack และ WhatsApp เพิ่มเติมแล้ว

Google Assistant จะอ่านข้อความเหล่านี้ได้ก็ต่อเมื่อผู้ใช้อนุญาตให้มันเข้าถึงการแจ้งเตือน (Notification Access) ก่อน แล้วจึงสั่ง Read my messages ตัว Google Assistant จะอ่านข้อความให้จากแอปเหล่านี้ที่รองรับจากหน้าแจ้งเตือน ก่อนจะให้เราตอบกลับได้ทั้งผ่านเสียงหรือพิมพ์ก็ได้ โดยกรณีของ Slack ตัว Google Assistant จะบอกชื่อ Workspace แทนที่จะเป็นชื่อผู้ส่งข้อความ

แน่นอนฟีเจอร์นี้เบื้องต้นน่าจะรองรับเฉพาะภาษาอังกฤษก่อน

Tags:
Node Thumbnail

Ping An Good Doctor แพลตฟอร์มด้านสุขภาพที่ใช้ AI ในการช่วยแพทย์ในการวินิจฉัยโรคเปิดให้บริการในสิงคโปร์ภายใต้ชื่อ AskBob ด้วยความร่วมมือกับ SingHealth ระบบข้อมูลคนไข้กลางและ National University Health System (NUHS)

Ping An ร่วมมือกับ SingHealth ในการเก็บข้อมูลและประมวลผลข้อมูลทางการแพทย์มาตั้งแต่เดือนเมษายน โดยตั้งเป้าช่วยแพทย์ในการรักษาโรคเบาหวานในสิงคโปร์ก่อน ขณะที่ NUHS เริ่มนำ AskBob ไปทดสอบกับแพทย์จริงแล้ว

ที่มา - SCMP

Tags:
Node Thumbnail

ไมโครซอฟท์ประกาศลงทุนใน OpenAI บริษัทวิจัย AI แบบไม่หวังผลกำไรที่ก่อตั้งโดย Elon Musk เป็นมูลค่า 1 พันล้านดอลลาร์

การลงทุนของไมโครซอฟท์มาด้วยเงื่อนไขว่า ไมโครซอฟท์กับ OpenAI จะร่วมกันพัฒนาเทคโนโลยีซูเปอร์คอมพิวเตอร์ในการประมวลผล Azure AI, OpenAI จะพอร์ตบริการของตัวเองไปรันบน Azure และไมโครซอฟท์จะเป็นพาร์ทเนอร์หลัก (preferred partner) ของ OpenAI ในการหารายได้จากเทคโนโลยีด้าน AI ต่อไป

Elon Musk ลาออกจากการเป็นบอร์ดของ OpenAI ในปี 2018 เพื่อป้องกันผลประโยชน์ทับซ้อนกับงานด้าน AI ของ Tesla ปัจจุบันซีอีโอของ OpenAI คือ Sam Altman อดีตประธานของบริษัทลงทุน Y Combinator

Tags:
Node Thumbnail

กูเกิลรายงานการสร้างปัญญาประดิษฐ์ SMILY ที่เป็นโมเดล deep learning สำหรับการค้นหาภาพเนื้อเยื่อจากฐานข้อมูลมะเร็ง The Cancer Genome Atlas โดยความพิเศษคือ SMILY นั้นไม่ได้ฝึกด้วยภาพเนื้อเยื่อมะเร็งหรือภาพทางการแพทย์แต่อย่างใด

SMILY เป็นโมเดล deep learning ที่สร้างจากภาพทั่วไป เช่น ต้นไม้, สุนัข ฯลฯ จำนวนมากถึง 5,000 ล้านภาพ โดยโมเดลมีเอาท์พุตเป็นข้อมูลสรุปย่อของภาพ หรือ embedding

Node Thumbnail

ไมโครซอฟท์โชว์ฟีเจอร์ใหม่ของ PowerPoint ชื่อ Presenter Coach ใช้ AI ช่วยให้คะแนนการซ้อมพรีเซนต์ของเรา ว่าพูดดีหรือไม่ พูดเร็วไปหรือไม่ หรือควรใช้คำที่สละสลวยกว่าแทน

ฟีเจอร์นี้จะถูกใช้ตอนกด Present (แบบซ้อม) โดยเรามีหน้าที่พูดตามสไลด์ไปเรื่อยๆ แล้ว AI ของ PowerPoint จะขึ้นบนหน้าจอว่าเราพูดด้วยความเร็วเท่าไร เร็วเกินไปหรือช้าเกินไป และเมื่อพูดเสร็จแล้ว PowerPoint จะให้คะแนนอย่างละเอียด พร้อมคำแนะนำว่าควรแก้ไขการพูดอย่างไรบ้าง

PowerPoint เวอร์ชันเว็บจะได้ฟีเจอร์นี้ก่อนเป็นรายแรกในอีกไม่กี่เดือนข้างหน้า

ที่มา - Microsoft

Tags:
Node Thumbnail

Masayoshi Son ซีอีโอ SoftBank กล่าวในงานสัมมนาประจำปีกับซัพพลายเออร์และลูกค้า มีเนื้อหาตอนหนึ่งบอกว่าที่ผ่านมาญี่ปุ่นถือเป็นผู้นำด้านเทคโนโลยีมาโดยตลอด แต่หากพูดถึงเทคโนโลยีที่มีบทบาทในโลกตอนนี้นั่นคือ AI (Artifical Intelligence) ญี่ปุ่นก็อยู่ในระดับประเทศกำลังพัฒนาเท่านั้น

เขากล่าวถึงเรื่องนี้ เพื่อให้เหตุผลว่าทำไมกองทุน Vision Fund ของ SoftBank จึงไม่ค่อยลงทุนในสตาร์ทอัพของประเทศญี่ปุ่น โดยเขามองว่าญี่ปุ่นไม่มีสตาร์ทอัพใดที่เรียกได้ว่าโดดเด่นในระดับโลก ยิ่งเมื่อพูดถึงวิศวกรด้าน AI ญี่ปุ่นเองก็ขาดแคลน หลายบริษัทเริ่มแก้ปัญหาโดยจ้างพนักงานจากต่างประเทศเข้ามาแล้ว

Tags:
Node Thumbnail

เมื่อวานนี้ Elon Musk และ Neuralink บริษัทของเขาได้เปิดเผยต่อสาธารณชนว่ากำลังสร้างสายสื่อประสาทเพื่อเชื่อมสมองมนุษย์เข้ากับคอมพิวเตอร์ สร้างความฮือฮาให้ทั้งโลกเป็นอย่างมาก

ในงานแถลงข่าว Elon ระบุว่าวัตถุประสงค์ทางการแพทย์เป็นเป้าหมายระยะสั้นเท่านั้น กล่าวคือเป็นการช่วยผู้ป่วยโรคสมองหรือผู้ที่ได้รับบาดเจ็บที่กระดูกสันหลังหรือเป็นโรคแต่กำเนิดให้สามารถใช้ชีวิตได้สะดวกขึ้น เช่นสามารถกลับมาขยับตัวหรือรับความรู้สึกได้เหมือนคนทั่วไป

Tags:
Node Thumbnail

Amazon ประกาศความสามารถทางภาษาของผู้ช่วยอัจฉริยะ Alexa ว่ากำลังพัฒนาให้สามารถรับคำสั่งและโต้ตอบกับผู้ใช้ในภาษาฮินดีได้ โดยเปิดรับให้นักพัฒนาเข้ามาพัฒนาทักษะ Alexa ในภาษาฮินดีผ่านช่องทาง Alexa Skills Kit โดยต้องเข้าไปเลือกเป็นภาษา IN ก่อนที่ Alexa Developer Console

ในอินเดียมีการใช้หลายภาษา โดยฮินดีเป็นหนึ่งในภาษาทางการที่คนอินเดียใช้กัน ซึ่ง Google Assistant มีรองรับภาษาฮินดีแล้ว

Tags:
Node Thumbnail

Megvii สตาร์ทอัพจากจีนที่พัฒนา AI รู้จำและแยกแยะใบหน้าบุคคล ซึ่งรัฐบาลจีนใช้สำหรับระบบตรวจสอบความปลอดภัย ได้ต่อยอดเทคโนโลยีดังกล่าว โดยจากการแยกคน ก็นำมาใช้กับการแยกแยะสัตว์เลี้ยง

โดย Megvii ได้ออกแอปตัวใหม่ซึ่งตอนนี้ใช้สำหรับเก็บข้อมูลเพื่อการระบุสุนัข ซึ่งสุนัขนั้นสามารถแยกแยะได้โดยอาศัยภาพของจมูก ที่เป็นอัตลักษณ์เหมือนกับลายนิ้วมือของมนุษย์

วิธีใช้งานก็คือการลงทะเบียนสุนัข โดยกรอกข้อมูลพร้อมกับภาพถ่ายจมูกสุนัข ซึ่งระบบต้องการภาพในหลาย ๆ มุมมอง เพื่อความละเอียดแม่นยำ ซึ่งตอนนี้ Megvii เคลมว่าระบบมีความแม่นยำที่ 95% จากฐานข้อมูลสุนัข 15,000 ตัว

Tags:
Node Thumbnail

เดือนที่แล้วมีผู้พัฒนาโปรแกรมสร้างภาพโป๊จากภาพปกติโดยใช้ชื่อ DeepNude แม้ภายหลังผู้สร้างจะเปลี่ยนใจหยุดขายโปรแกรมไปแต่ก็มีผู้ได้รับโปรแกรมไปจำนวนหนึ่งและเริ่มมีการนำมาแจกจ่ายกัน แพลตฟอร์มขนาดใหญ่อย่าง Discord และ GitHub ก็เริ่มแสดงท่าทีต่อการแจกโปรแกรมนี้

GitHub ลบ repository ที่อัพโหลดไพธอนโค้ดที่ decompile จาก DeepNude โดยระบุว่าผิดตามมาตรฐานชุมชนที่ห้ามใช้อัพโหลดคอนเทนต์อนาจาร แต่ทาง GitHub ไม่ได้มอนิเตอร์กรณีนี้เป็นพิเศษ แต่ตรวจสอบจากการแจ้งของผู้ใช้

Tags:
Node Thumbnail

อินเทลประกาศความร่วมมือกับไป่ตู้พัฒนาชิปปัญญาประดิษฐ์ Nervana Neural Network Processor for Training (NNP-T) หลังจากก่อนหน้านี้ไป่ตู้ได้ร่วมมือกับอินเทลออปติไมซ์เฟรมเวิร์คปัญญาประดิษฐ์ PaddlePaddle ของตัวเองให้ทำงานร่วมกับชิป Xeon ได้เต็มประสิทธิภาพมาก่อนแล้ว

ชิป NNP-T ยังไม่มีข้อมูลมากนัก แต่อินเทลระบุว่าจะเป็นฮาร์ดแวร์ประเภทใหม่เพื่อการฝึกโมเดลปัญญาประดิษฐ์โดยเฉพาะ มีแบนด์วิดท์หน่วยความจำที่สูง, และรองรับการกระจายโหลดงาน

ตัวชิปยังไม่มีกำหนดว่าจะวางตลาดได้ช่วงใด

ที่มา - Intel

Tags:
Node Thumbnail

ซัมซุงประกาศเปิดตัว Bixby Marketplace สำหรับค้นหาแอปและบริการที่จะนำมาใช้งานและเชื่อมต่อเข้ากับ Bixby ในเครื่อง หรือเปรียบเทียบอย่างง่ายคือคล้ายๆ กับหน้าสโตร์ที่เอาไว้ค้นหา Alexa Skills ของ Amazon

ตัวบริการหรือแอปที่เชื่อม ทางซัมซุงเรียกว่าแคปซูล และแน่นอนว่าแพลตฟอร์ม Bixby จะเรียนรู้พฤติกรรมการใช้งานผู้ใช้และพยายามนำเสนอแคปซูลที่น่าจะใช้งานให้ตรงใจที่สุด ขณะที่หน้า Bixby Marketplace จะเข้าถึงได้จากการปัดด้านซ้ายจากหน้าหลักของ Bixby (ที่เปิดขึ้นมาจากการกดปุ่ม Bixby)

Bixby Marketplace เปิดให้ใช้งานก่อนในสหรัฐและเกาหลีใต้

ที่มา - Samsung

Tags:
Node Thumbnail

เมื่อปี 2016 กูเกิลเปิดฐานข้อมูลวิดีโอบน YouTube 8 ล้านคลิป (YouTube-8M) เพื่อใช้เทรน AI ประมวลผลวิดีโอ และมีทีมวิจัยด้าน AI กว่า 1,000 ทีมเข้ามาร่วมแข่งขันพัฒนา AI ให้เข้าใจความหมายของวิดีโอมากที่สุด

ปี 2019 กูเกิลกลับมาพร้อมฐานข้อมูลชุดใหม่ชื่อ YouTube-8M Segments ที่พัฒนาจากฐานข้อมูลเดิม โดยตัดวิดีโอเป็นท่อนๆ (segment) ยาวท่อนละประมาณ 5 วินาที จำนวนทั้งหมดประมาณ 237,000 ท่อน ซึ่งใช้คนช่วยแยกแยะข้อมูลแล้วว่าวิดีโอแต่ละท่อนเกี่ยวข้องกับอะไรบ้าง

Tags:
Node Thumbnail

เว็บ Vice.com เผยแพร่บทสัมภาษณ์ผู้สร้าง DeepNude ซอฟต์แวร์ที่สร้างจากโมเดลปัญญาประดิษฐ์ที่สร้างภาพโป๊จากภาพผู้หญิงที่สวมเสื้อผ้าอยู่ โดยมีรุ่นฟรีที่เซ็นเซอร์ และรุ่นเสียเงิน 50 ดอลลาร์ไม่มีเซ็นเซอร์ มีเพียงตราตรงมุมภาพว่าเป็นภาพปลอมเท่านั้น

DeepNude เป็นด้านกลับของ DeepFake ซอฟต์แวร์ที่สร้างจากโมเดลปัญญาประดิษฐ์ที่วางใบหน้าของคนที่ผู้ใช้ต้องการเข้าไปบนภาพหรือวิดีโอโป๊ โดย DeepNude จะวาดร่างกายที่ไม่ได้ใส่เสื้อผ้าเข้าไปบนภาพจริงแทน ทำให้ภาพโป๊ที่ได้เป็นท่าทางจริงของภาพต้นฉบับ แม้จะสร้างภาพให้สมจริงแต่ภาพร่างกายก็เป็นภาพที่โมเดลปัญญาประดิษฐ์สร้างขึ้นมาเท่านั้น ไม่ใช่ภาพจริงที่มองทะลุเสื้อผ้าได้แต่อย่างใด

Tags:
Node Thumbnail

นักวิจัยจาก Global Pulse โครงการวิจัยด้าน Big Data, AI ของ UN ได้เผยแพร่เปเปอร์งานวิจัยที่ว่าด้วยการฝึก AI ให้สามารถเขียนสุนทรพจน์สำหรับในการประชุมสามัญของ UN ได้ภายใน 13 ชั่วโมงและงบประมาณเพียง 7.8 เหรียญ ซึ่งเป็นค่าใช้จ่ายในการใช้งานแพลตฟอร์มคลาวด์

เครื่องมือที่ Global Pulse ใช้เป็นเครื่องมือโอเพนซอสทั้งหมด ส่วนข้อมูลที่ป้อนเอาจากสุนทรพจน์ทั้งหมดที่ถูกพูดในการประชุมสามัญของ UN ตั้งแต่ปี 1970 ถึง 2015 ก่อนจะแบ่งออกมาเป็น 3 หมวดใหญ่ๆ คือหัวข้อทั่วไป (อาทิ โลกร้อน), สุนทรพจน์เปิดประชุมของเลขาธิการ UN และประเด็นที่อ่อนไหว อาทิ ชมกลุ่มน้อย โดยใช้โมเดล Deep Learning

Tags:
Node Thumbnail

ทีมงาน PyTorch เปิดตัวบริการ PyTorch Hub บริการเชื่อมงานวิจัยเข้ากับโมเดลปัญญาประดิษฐ์เพื่อให้นักวิจัยภายนอกสามารถตรวจการทำงานของโมเดลที่เผยแพร่ออกมาได้ดีขึ้น

PyTorch Hub ทำให้ผู้ใช้สามารถค้นหาและดาวน์โหลดโมเดลได้ง่ายๆ เหมือนการดาวน์โหลดอิมเมจของ Docker เช่น การรันโค้ด torch.hub.list('pytorch/vision') ก็จะได้รายการโมเดลของ PyTorch สำหรับการประมวลผลภาพออกมา และสามารถสั่งดาวน์โหลดได้ด้วยคำสั่งเดียว

กระบวนการส่งโมเดลขึ้น Hub ต้องส่งผ่าน pull request บน GitHub เพื่อให้ทีมงานพิจารณา และอาจขอให้เจ้าของโมเดลปรับแก้เพื่อให้ใช้งานได้ง่ายขึ้น จากนั้นโมเดลจะได้เผยแพร่บนเว็บ PyTorch Hub

Tags:
Node Thumbnail

ทีมงาน Google Brain เปิดตัวเอนจิน Google Research Football เกมเอนจินที่เปิด API ให้นักวิจัยสร้างปัญญาประดิษฐ์มาแข่งเกมฟุตบอลแบบ reinforcement learning (RL) หรือการพัฒนาปัญญาประดิษฐ์ที่ตัวปัญญาประดิษฐ์เรียนรู้ว่าต้องชิง "รางวัล" ให้ดีที่สุด

แกนหลักของ Google Research Football คือ Football Engine เป็นเอนจินเกมฟุตบอลสามมิติแบบโอเพนซอร์ส จำลองเหตุการณ์ได้ค่อนข้างครบ ทั้งการทำประตู, การทำฟาวล์, ยิงลูกโทษ, และล้ำหน้า เอนจินเน้นประสิทธิภาพการเรนเดอร์ (สำหรับปัญญาประดิษฐ์ที่ต้องการฝึกมองจากภาพโดยตรง) โดยเครื่องซีพียู 6 คอร์รันได้ถึง 25 ล้านภาพต่อวัน หรือยากฝึกผ่าน API ที่ทำให้มองเห็นสนามเป็นรูปแบบที่คอมพิวเตอร์เข้าใจได้ง่ายก็ได้เหมือนกัน

Tags:
Node Thumbnail

ทีมวิจัยร่วมระหว่างมหาวิทยาลัย Curtin และมหาวิทยาลัย Queensland สร้างปัญญาประดิษฐ์ที่สามารถจำแนกโรคทางเดินหายใจจากเสียงไอในเด็กได้ โดยหากใช้เสียงอย่างเดียวมีความแม่นยำสูงกว่าทีมแพทย์ที่ฟังเสียงไออย่างเดียวเหมือนกัน

ปัญญาประดิษฐ์สามารถแยกโรค หอบหืด (asthma), ปอดบวม (pneumonia), โรคครูป (croup), โรคหลอดลมอักเสบ (bronchiolitis), และโรคติดเชื้อระบบทางเดินหายใจส่วนล่าง (lower respiratory tract disease) โดยทีมแพทย์และปัญญาประดิษฐ์ได้ฟังเสียงไออย่างเดียวเหมือนๆ กัน

กลุ่มตัวอย่างเป็นเด็กอายุ 29 วันถึง 12 ปี จำนวน 585 คน ทุกโรคปัญญาประดิษฐ์สามารถวินิจฉัยได้แม่นยำกว่าแพทย์ เช่นโรคหอบหืด ทำนายได้แม่นถึง 97% เทียบกับแพทย์ 91% โดยรวมอยู่ในช่วง 83-97% ขณะที่แพทย์วินิจฉัยได้แม่น 81-91%

Tags:
Node Thumbnail

เชื่อว่าผู้หญิงหลายคนต้องอยากใส่เสื้อผ้าตามคนดัง แต่เมื่อเห็นแต่รูปก็ไม่รู้ว่าจะไปหาเสื้อผ้าสไตล์นี้ได้ที่ไหน ล่าสุด Amazon เปิดตัว StyleSnap ฟีเจอร์ให้ AI ช่วยหาชุดให้ใน Amazon App โดยผู้ใช้สามารถอัพโหลดรูปเสื้อผ้าที่ไปเจอมาเข้าไปในแอพ ระบบจะช่วยหาเสื้อผ้าที่มีดีไวน์คล้ายกับในรูปที่สามารถหาซื้อได้บน Amazon ให้

เว็บไซต์ The Verge ระบุว่า ฟีเจอร์ดังกล่าวยังทำงานได้ไม่ดีนัก ยังไม่สามารถระบุรายละเอียดต่างๆ ของเสื้อผ้าได้ และยังเสนอไอเท็มซ้ำๆ เดิมๆ นอกจากนี้ยังมีสตาร์ทอัพเจ้าอื่นที่ทำฟีเจอร์ในทำนองเดียวกันนี้ รวมถึง Asos ยักษ์ใหญ่แฟชั่นออนไลน์

Tags:
Node Thumbnail

เดือนที่แล้วในงาน Google I/O นอกจากการเปิดตัว API ต่างๆ ของกูเกิลเองแล้ว ในงานส่วนนิทรรศการยังมีการแสดงสาธิตการใช้เทคโนโลยีรูปแบบต่างๆ โดยในนิทรรศการทั้งหมด บริษัท bit.studio จากประเทศไทยไทยก็ได้จัดนิทรรศการในงานด้วย

Tags:
Node Thumbnail

โลกเครือข่ายสังคมออนไลน์มักมีการทำอะไรตามๆ กันเป็นระยะ เช่น การเต้นโคฟเวอร์เพลง Gangnam Style, หรือการท้า Ice Bucket Challenge เป็นต้น งานวิจัยล่าสุดของกูเกิลสามารถสร้างชุดข้อมูลจากการท้ากันเช่นนี้ ทำให้ได้โมเดลแปลงวิดีโอเป็นวิดีโอสามมิติที่มีความแม่นยำสูง

ทีมวิจัยของกูเกิลอาศัยวิดีโอ Mannequin Challenge ที่กลุ่มคนพยายามรวมตัวกันจำลองว่าตัวเองเป็นหุ่น (mannequin) แล้วเคลื่อนกล้องไปเรื่อยๆ โดยทีมวิจัยพบว่าวิดีโอเหล่านี้สามารถแปลงเป็นภาพสามมิติได้โดยง่ายด้วยเทคนิค multi-view-stereo (MVS) ที่ใช้ภาพหลายภาพมาสร้างภาพสามมิติ ทีมงานพบวิดีโอกลุ่มนี้บน YouTube กว่าสองพันรายการ ทำให้ได้ภาพของคนทำท่าทางต่างๆ อย่างครบถ้วน

Tags:
Node Thumbnail

ช่วงนี้แนวคิด Edge Server หรือการตั้งเซิร์ฟเวอร์ประมวลผล AI ที่ปลายทาง (แล้วค่อยส่งขึ้นคลาวด์) กำลังมาแรง เราเริ่มเห็นโซลูชันจากหลายๆ บริษัทออกสู่ตลาด เช่น ฮาร์ดแวร์ Coral ของกูเกิล, ซอฟต์แวร์จากไมโครซอฟท์, คอมพิวเตอร์อุตสาหกรรมของ Lenovo เป็นต้น

NVIDIA ในฐานะผู้สร้างหน่วยประมวลผลจีพียูสำหรับงาน AI ก็ไม่พลาดสงครามนี้เช่นกัน ล่าสุดเปิดตัว NVIDIA EGX โดยเรียกตัวเองว่าเป็น "GPU Edge Server"

Tags:
Node Thumbnail

ทีมวิจัยร่วมระหว่างไมโครซอฟท์และมหาวิทยาลัยเจ้อเจียง (Zhejiang University) รายงานความสำเร็จในการออกแบบปัญญาประดิษฐ์ที่สามารถแปลงข้อความเป็นเสียงพูด (text-to-speech - TTS) และแปลงเสียงพูดเป็นข้อความ (automatic speech recognition - ASR) โดยใช้ข้อมูลปริมาณน้อยมาก คิดเป็นเสียงพูดประมาณ 20 นาทีเท่านั้น แต่ยังความแม่นยำของการสร้างเสียงพูดที่ฟังออก (intelligible rate) สูงถึง 99.84%

Tags:
Node Thumbnail

เราเคยเห็นโมเดลการสร้างวิดีโอปลอม หรือคลิปเสียงปลอม ที่พัฒนาจากการเทรนข้อมูลคลิปวิดีโอและคลิปเสียงจำนวนมาก หรือ Deepfake แต่งานวิจัยล่าสุดที่เผยแพร่โดย Samsung AI Center สามารถพัฒนาผลลัพธ์ได้ไกลกว่านั้น โดยอาจใช้ข้อมูลเริ่มต้นด้วยรูปภาพเพียง 1 รูปเท่านั้น

รูปแบบการสร้างคลิปดังกล่าว อาศัยการเทรนข้อมูลคลิปวิดีโออื่นที่เป็นการถ่ายเจาะเฉพาะใบหน้าจำนวนหนึ่งก่อน จากนั้นจับเฉพาะตำแหน่งสำคัญบนใบหน้าเพื่อใช้ในการสร้างคลิปวิดีโอ เช่น คิ้ว ตา จมูก ปาก เมื่อเราให้ข้อมูลภาพถ่ายใบหน้า ก็สามารถสร้างวิดีโอปลอมขึ้นมา โดยอาศัยการจับตำแหน่งสำคัญเหล่านั้น แล้วทำการขยับส่วนต่าง ๆ บนใบหน้าออกมานั่นเอง

Pages