Computer Vision | Blognone

Flippy หุ่นยนต์ทำเบอร์เกอร์ ที่ไม่ได้เป็นแค่แขนกลตั้งเวลาย่างเนื้อ

By: ตะโร่งโต้ง

on 14 March 2018 - 02:02 Tags:

Topics:

Robot

Food

Computer Vision

ถึงตอนนี้ทุกคนคงรู้ดีกันอยู่แล้วว่าหุ่นยนต์สามารถทำงานแทนคนได้หลายอย่าง ไม่ว่าจะเป็นงานสายการผลิตในโรงงาน, งานประชาสัมพันธ์และต้อนรับในโรงแรม แน่นอนว่ามีแม้กระทั่งหุ่นยนต์ปรุงอาหารในร้านอาหาร และ Flippy หุ่นยนต์นักทำเบอร์เกอร์ ผลงานการพัฒนาโดย Miso Robotics ก็คือหนึ่งในนั้น มันไม่ได้เป็นแค่หุ่นยนต์แขนกลธรรมดาที่ย่างเบอร์เกอร์ไปวันๆ มันมองเห็น คิดเป็น และถูกออกแบบมาให้ทำงานร่วมกับคนได้

ล้ำไปอีกขั้น Pornhub นำปัญญาประดิษฐ์เข้ามาช่วยจัดการเนื้อหาให้ดียิ่งขึ้น

By: MrThursday

on 13 October 2017 - 00:22 Tags:

Topics:

Pornhub

Artificial Intelligence

Computer Vision

Porn

ปัจจุบันศาสตร์ทางด้านปัญญาประดิษฐ์และการประมวลผลแบบกระจายได้พัฒนามาไกลมาก สองถึงสามปีมานี้จึงได้มีการนำสองเทคโนโลยีนี้มาใช้ควบคู่กันเพื่อพัฒนาคุณภาพการบริการและผลิตภัณฑ์ของบริษัทต่าง ๆ อย่างแพร่หลาย ตลอดจนปริมาณเนื้อหาบนโลกอินเทอเน็ตที่มากขึ้นเป็นทวีคูณ ทำให้ล่าสุด Pornhub ผู้ให้บริการเนื้อหาภาพยนต์สำหรับผู้ใหญ่เบอร์หนึ่งของโลก ได้นำปัญญาประดิษฐ์เข้ามาช่วยเพิ่มประสิทธิภาพในการจัดการเนื้อหาบนเว็บไซต์โดยการติดป้ายกำกับเพื่อจัดหมวดหมู่ให้เหมาะสมและแม่นยำยิ่งขึ้น

กูเกิลโชว์งานวิจัย ใช้อัลกอริทึมลบลายน้ำของภาพถ่ายได้แบบง่ายๆ

By: mk

on 18 August 2017 - 10:09 Tags:

Topics:

Google

Research

Computer Vision

ทีมวิจัยของ Google Research เผยแพร่งานวิจัยที่ใช้ AI ลบลายน้ำออกจากภาพถ่ายได้อย่างง่ายๆ

ทีมวิจัยระบุว่ารูปแบบของลายน้ำ (watermark) ในปัจจุบันที่วางทับไปบนภาพถ่าย อาจเป็นเรื่องยากสำหรับมนุษย์ในการลบมันออก แต่จริงๆ แล้วลายน้ำกลับมีแพทเทิร์นที่ค่อนข้างตายตัว เช่น มีความโปร่งแสง (opacity) เท่ากันตลอด และถ้าเรามีภาพถ่ายหลายๆ ภาพที่มีลายน้ำรูปเดียวกัน เราสามารถสร้างภาพสมบูรณ์ของลายน้ำขึ้นมาใหม่ เพื่อให้รู้ขอบเขตในการลบลายน้ำออกได้

Facebook เข้าซื้อ Fayteq สตาร์ทอัพ computer vision จากเยอรมนี

By: nutmos

on 12 August 2017 - 20:02 Tags:

Topics:

Facebook

Acquisition

Computer Vision

Facebook เข้าซื้อบริษัท Fayteq ซึ่งเป็นสตาร์ทอัพด้าน computer vision จากเยอรมนี มีผลงานในการพัฒนาปลั๊กอินเพื่อลบวัตถุออกจากวิดีโอสำหรับโปรแกรมอย่าง After Effects

เทคโนโลยีของ Fayteq นั้นสามารถใช้เพื่อเพิ่มฟีเจอร์ให้กับ Facebook Live หรือ Stories เพื่อเสริมความแข็งแกร่งให้บริการได้ หรือจะพัฒนาปลั๊กอินสำหรับ After Effects ต่อไปเพื่อเป็นเครื่องมือสร้างเอฟเฟค AR สำหรับนักพัฒนาก็ได้

สำหรับรายละเอียดในการเข้าซื้อของ Facebook นั้นยังไม่ได้เผยออกมามากนัก แต่ทางบริษัทก็ได้ยืนยันการเข้าซื้อบริษัทอย่างเป็นทางการแล้ว

ที่มา - Engadget

วิดีโอก็เชื่อไม่ได้ งานวิจัยสร้างวิดีโอจากเสียงได้อย่างสมจริง

By: lew

on 15 July 2017 - 22:25 Tags:

Topics:

Deep Learning

Computer Vision

คุณศุภศรณ์ สุวจนกรณ์ จากห้องวิจัย GRAIL นำเสนองานวิจัยในการสร้างวิดีโอของบารัก โอบามา ตามเสียงที่ใส่เข้าไปได้อย่างสมจริง โดยอาศัยข้อมูลเสียงนำมาสร้างเป็นรูปแบบของปากแล้วจึงใส่รายละเอียดลงไปก่อนจะนำภาพปากเคลื่อนไหวนี้ไปใส่วิดีโอเป้าหมาย

งานวิจัยนี้ทำให้สามารถนำเสียงของโอบามาเองมาสร้างภาพวิดีโอใหม่ โดยไม่ต้องอาศัยวิดีโอของการพูดครั้งนั้นจริงๆ แม้แต่เสียงที่สร้างขึ้นมา เช่น เสียงของคนที่เลียนแบบโอบามา หรือเสียงของโอบามาที่ถูกตัดต่อ

กูเกิลออก MobileNets โมเดลประมวลผล AI ด้วย TensorFlow บนมือถือ กินพลังงานต่ำ

By: mk

on 19 June 2017 - 16:26 Tags:

Topics:

Artificial Intelligence

กูเกิลประกาศออกชุดโมเดล MobileNets สำหรับการประมวลผล AI บนสมาร์ทโฟนที่มีทรัพยากรจำกัด ตามแผนการผลักดัน TensorFlow ให้ทำงานบนมือถือได้

กูเกิลบอกว่าถึงแม้เราอยู่ในยุคของคลาวด์ สามารถเรียกประมวลผลภาพได้ผ่านบริการอย่าง Cloud Vision API แต่ก็มีกรณีที่จำเป็นต้องประมวลผล AI แบบออฟไลน์บนมือถือ ซึ่งช่วงหลังมีสมรรถนะสูงมากพอแล้ว

ARM โอเพนซอร์สไลบรารีประมวลผลภาพ, ปัญญาประดิษฐ์

By: lew

on 4 April 2017 - 10:54 Tags:

Topics:

Artificial Intelligence

ปัญญาประดิษฐ์และการประมวลผลภาพในโทรศัพท์มือถือมีการใช้งานมากขึ้นเรื่อยๆ เช่น ฟิลเตอร์เครื่องแต่งกายตามแอปไลฟต์ต่างๆ ตอนนี้ ARM ก็ออกมาปล่อยไลบรารีสำหรับการรีดประสิทธิภาพซีพียูและจีพียูให้ทำงานเหล่านี้ได้ดียิ่งขึ้น

ARM Compute Library รองรับฟังก์ชั่นพื้นฐานคล้ายกับ OpenCV เช่น การประมวลสีภาพ หรือฟิลเตอร์ HOG (histogram of oriented gradients) ไปจนถึงฟังก์ชั่นคอมพิวเตอร์เรียนรู้ด้วยตัวเอง เช่น SVM (support vector machines) หรือ convolutional neural networks

Flickr เปิดตัวฟีเจอร์ค้นหาภาพที่เหมือนกัน โดยใช้ deep neural network ในการวิเคราะห์ภาพ

By: nutmos

on 8 March 2017 - 22:24 Tags:

Topics:

Flickr

Computer Vision

Yahoo! ได้เปิดตัวฟีเจอร์ Similarity Search ซึ่งเป็นผลงานจากทีมงาน Computer Vision ของ Yahoo! ที่ทำงานร่วมกับ Flickr

สำหรับฟีเจอร์ใหม่นี้ คือการค้นหาภาพที่เหมือนกัน โดยจะใช้วิธีการดูจากลักษณะของภาพ ซึ่งเป็นสิ่งที่ Flickr เรียกว่า similarity pivot คือกลุ่มของภาพที่มีความเหมือนกัน

ปัจจัยที่ Flickr จะใช้พิจารณาความเหมือนก็มีทั้งสี, ลวดลาย, หมวดหมู่ และอื่น ๆ ซึ่ง Flickr ได้ใช้งาน deep neural networks เพื่อทำการระบุวัตถุ และทำการแท็กภาพให้ว่าเป็นภาพในหมวดหมู่อะไรโดยอัตโนมัติ จากนั้นนำมาทำเป็นเวกเตอร์ที่เรียกว่า feature vector

Apple เผยงานวิจัย AI ชิ้นแรกออกสู่สาธารณะแล้ว เป็นเรื่องเทคโนโลยี computer vision

By: nutmos

on 27 December 2016 - 17:04 Tags:

Topics:

Apple

Computer Vision

Artificial Intelligence

Apple ได้ออกงานวิจัยเกี่ยวกับปัญญาประดิษฐ์ชิ้นแรกของบริษัทสู่สาธารณะตามที่เคยประกาศไว้ ซึ่งงานวิจัยชิ้นนี้เป็นรายละเอียดเกี่ยวกับการวิจัยเทคโนโลยี computer vision ที่ทางบริษัทกำลังพัฒนาอยู่ โดยยกตัวอย่างเป็นการใช้งานเพื่อระบุภาพถ่าย

พร้อมใช้งานในรถและกล้องวงจรปิด กราฟิก PowerVR ผ่านการทดสอบ OpenVX 1.1

By: lew

on 19 December 2016 - 12:40 Tags:

Topics:

Imagination

PowerVR

Computer Vision

ชุด API OpenVX เป็น API มาตรฐานสำหรับการประมวลผลภาพ เช่น การจับวัตถุในภาพ, การจดจำใบหน้า, และการตรวจจับการเคลื่อนไหว ตอนนี้ Imagination ก็ออกมาประกาศว่าส่วนกราฟิก PowerVR ผ่านการทดสอบ OpenVX 1.1 เป็นรายแรก

ตัว API ของ OpenVX จะคล้ายกับ OpenCV ในหลายส่วน ทั้ง data type สำหรับการเก็บภาพถ่าย การปรับขนาดภาพ และการประมวลผลภาพในระดับต่ำ API เหล่านี้เปิดให้ผู้ผลิตฮาร์ดแวร์พัฒนาฮาร์ดแวร์ให้เร่งความเร็วการประมวลผลเหล่านี้ให้ได้ประสิทธิภาพสูงสุด

ชิปตัวแรกที่ผ่านการทดสอบ คือ Allwinner A80 ที่ใช้ส่วนกราฟิก PowerVR G6230 ชิปตัวนี้มีใช้ในบอร์ดหลายตัว ใครสนใจอยากใช้ OpenVX คงหามาใช้งานกันได้ไม่ยาก

อย่างนี้ก็มีด้วย? ชายรัสเซียโดนใบสั่งเพราะเงารถพาดทับเส้นทึบ

By: ตะโร่งโต้ง

on 8 September 2016 - 11:02 Tags:

Topics:

Computer Vision

Traffic

Russia

ในเมื่อสี่เท้ายังรู้พลาด คอมพิวเตอร์ก็อาจจะรู้พลั้งได้เหมือนกัน ดังเช่นเหตุการณ์ในประเทศรัสเซีย ที่หน่วยงานตำรวจจราจรได้ออกใบสั่งปรับเงินชายชาวรัสเซียคนหนึ่ง พร้อมแนบภาพถ่ายหลักฐานการกระทำผิดไปด้วย ซึ่งภาพก็แสดงให้เห็นชัดเจนว่าเป็นเพราะเขาขับรถแล้วเงาพาดทับเส้นทึบกลางถนน

อ่านไม่ผิดหรอก ภาพประกอบใบสั่งที่ชายคนดังกล่าวได้รับ แสดงภาพรถที่เขาขับเมื่อวันที่ 25 สิงหาคมที่ผ่านมาบนถนนวงแหวนของ Moscow จากในภาพตัวรถก็วิ่งอยู่ในช่องทางเดินรถตามปกติมิได้ล้ำออกนอกเส้นทึบแต่อย่างใด ทว่าเงาของตัวรถในขณะนั้นซึ่งเกิดจากแสงแดดได้ทอดผ่านทับข้ามเส้นทึบล้ำไปยังช่องทางเดินรถข้างๆ ที่อยู่ติดกัน

อินเทลซื้อ Movidius เจ้าของชิปประมวลผลภาพ Vision Processing Unit (VPU)

By: mk

on 7 September 2016 - 19:43 Tags:

Topics:

อินเทลประกาศซื้อบริษัท Movidius Technology เจ้าของระบบ "ตา" คอมพิวเตอร์ (visionary solution) ที่ใช้กับรถยนต์ โดรน หุ่นยนต์ แว่น VR และระบบลักษณะเดียวกันอื่นๆ

โซลูชันของ Movidius ประกอบด้วยหน่วยประมวลผลเฉพาะที่เรียกว่า Vision Processing Unit (VPU), ชุด SDK และประมวลผลภาพด้วยเทคนิค machine learning/deep learning

อินเทลซื้อ Movidius เพื่อนำเทคโนโลยีไปต่อเชื่อมกับกล้อง RealSense ของตัวเอง เพื่อต่อเป็นระบบ computer vision ที่เก่งกาจมากขึ้นในอนาคต

ไม่ใช่เรื่องโม้แค่ในหนัง มาดูการทำภาพใบหน้าเบลอๆ แบบโมเสค ให้ชัดขึ้นด้วย AI

By: ตะโร่งโต้ง

on 4 September 2016 - 21:16 Tags:

Topics:

Computer Vision

Image Processing

Artificial Intelligence

คงจะเคยดูหนังหรือละครต่างประเทศแนวสืบสวนสอบสวนกันมาบ้าง หลายครั้งที่เราเห็นฉากการตามหาคนแล้วดึงภาพมาจากกล้องวงจรปิด หรือกล้องมือถือที่ไหนสักแห่งแล้วเห็นภาพบุคคลเป้าหมายเบลอๆ เห็นแค่เม็ดพิกเซลเหมือนภาพโมเสค จากนั้นเจ้าหน้าที่ก็ซูมภาพ ซูมแล้วซูมอีก แล้วใช้ซอฟต์แวร์ปรับแต่งภาพให้มีความคมชัดขึ้น จากภาพเบลอๆ เหลี่ยมๆ ก็กลายเป็นภาพใบหน้าคนที่มีความคมชัดขึ้น วันนี้อยากบอกให้รู้ว่าเรื่องพวกนี้มันไม่ได้ขี้โม้เกินจริงสักเท่าไหร่เลย ตัวอย่างโปรแกรมของชายที่ชื่อ David Garcia พิสูจน์เรื่องนี้ให้เห็นได้อย่างดี

งานวิจัย MIT ทำภาพนิ่งให้ตอบสนองการดึง-ดันได้แบบสมจริงโดยไม่ต้องร่างโมเดล 3 มิติ

By: ตะโร่งโต้ง

on 9 August 2016 - 00:27 Tags:

Topics:

MIT

Computer Vision

Video

ทีมวิจัย CSAIL แห่ง MIT ได้เผยแพร่งานวิจัยใหม่ในชื่อ Interactive Dynamic Video ซึ่งเป็นเทคนิคเพิ่มลูกเล่นให้ภาพนิ่งที่ได้จากการถ่ายวิดีโอให้ตอบสนองทำปฏิสัมพันธ์กับการดึง-ดันวัตถุในภาพได้ โดยไม่ต้องทำการสร้างโมเดลกราฟิกแบบ 3 มิติใส่ลงในภาพนั้น

อธิบายให้เห็นภาพมากขึ้น ผู้ใช้สามารถใช้เม้าส์เพื่อไกวเปลในภาพนิ่งให้แกว่งได้, ใช้เม้าส์เพื่อเขย่าต้นไม้ให้สั่นไหว หรือดันพุ่มไม้ให้ยกตัวขึ้นก็ได้เช่นกัน (ไม่ใช่ในลักษณะก้อนโพลีกอนที่มีพื้นผิวสีเขียวเหมือนต้นไม้ หากแต่มีการแสดงผลให้เห็นการสั่นไหวของแต่ละกิ่งก้าน แต่ละใบอย่างเป็นธรรมชาติ) หรืออีกตัวอย่างก็เช่นสามารถใช้เม้าส์ดันสะพานแขวนในภาพให้ไหวเอน ทำได้แม้กระทั่งกดวางวัตถุลงในภาพสะพานในบริเวณต่างๆ ซึ่งจะมีผลทำให้ภาพสะพานแขวนยุบตัวลงได้ราวกับเป็นการตอบสนองของกราฟิก 3 มิติ

Faception เมื่อ AI ถูกใช้ระบุผู้ต้องสงสัยก่อการร้ายด้วยการตัดสินจากภาพถ่ายใบหน้า

By: ตะโร่งโต้ง

on 6 July 2016 - 21:18 Tags:

Topics:

Computer Vision

Terrorism

Machine Learning

Artificial Intelligence

คนที่หน้าตาเหมือนโจรเป็นยังไง? ต้องหนวดเคราเฟิ้ม ผมกระเซอะกระเซิงหรือเปล่า? ใบหน้าน่าจะมีรอยแผลเป็น ผิวหน้าดูหยาบกร้านไหม? ริ้วรอย, แววตา, สีหน้าล่ะ เป็นอย่างไร? เรื่องเหล่านี้คนเราอาจคาดคะเนแตกต่างกันไปตามปูมหลังและข้อมูลที่เคยผ่านหูผ่านตามาสำหรับแต่ละคน และปัญญาประดิษที่ชื่อ Faception ก็มีคำตอบสำหรับคำถามนี้ในแบบฉบับของตัวมันเองเช่นกัน

Faception เป็นผลงานการพัฒนาโดยสตาร์ทอัพชื่อเดียวกันจากอิสราเอล พวกเขาอ้างว่าเทคโนโลยี Faception นั้นมีระบบ machine learning ที่ผ่านการเรียนรู้ฐานข้อมูลภาพถ่ายใบหน้าของคนจำนวนมาก จนทำให้มันสามารถวิเคราะห์ภาพใบหน้าของบุคคลใดๆ เพื่อระบุบุคลิกลักษณะของบุคคลนั้น

นักวิจัยสร้าง AI ที่เปลี่ยนภาพถ่ายขาวดำให้กลับมามีสีสันใหม่ได้

By: ตะโร่งโต้ง

on 6 April 2016 - 23:03 Tags:

Topics:

Photography

Computer Vision

Color

Artificial Intelligence

นักวิจัยด้านคอมพิวเตอร์วิทัศน์แห่ง Berkeley ได้พัฒนาปัญญาประดิษฐ์ให้เรียนรู้ภาพถ่ายจำนวนมาก จนสามารถระบายสีภาพถ่ายขาวดำให้กลับเป็นภาพสีได้ราวกับฝีมือแต่งภาพของมนุษย์

Richard Zhang คือชื่อของผู้นำทีมวิจัยนี้ ผลงานของเขาคือปัญญาประดิษฐ์ที่สามารถเรียนรู้ได้โดยอาศัยโครงข่ายประสาทเทียมแบบ convolutional ซึ่งทำงานเลียนแบบระบบพื้นฐานการรับรู้ภาพของสมองคนเราจนสามารถจดจำรูปแบบของวัตถุในภาพและจัดหมวดหมู่วัตถุเหล่านั้น และด้วยการที่รู้ว่าสิ่งที่เห็นในภาพคืออะไร ทำให้มันคาดคะเนได้จากประสบการณ์ที่มันเรียนรู้ว่าสิ่งนั้นควรมีสีสันไปในโทนไหน

อย่าเพิ่งเชื่อที่ตาเห็น! เพราะงานวิจัยใหม่ทำให้แก้ไขภาพปากคนในวิดีโอขยับพูดได้ตามใจชอบ

By: ตะโร่งโต้ง

on 20 March 2016 - 01:52 Tags:

Topics:

Research

Stanford

Computer Vision

Face2Face คือชื่อของงานวิจัยด้านคอมพิวเตอร์วิทัศน์ที่จับเอาท่าทางการแสดงสีหน้าของคนคนหนึ่งไปใส่ในคลิปวิดีโอเพื่อเปลี่ยนการขยับริมฝีปากและการแสดงสีหน้าของคนในวิดีโอนั้นได้

งานวิจัยนี้เป็นผลงานร่วมกันระหว่าง University of Erlangen-Nuremberg, Max Planck Institute for Informatics และ Stanford University โดยทีมวิจัยได้พัฒนาระบบตรวจจับใบหน้าของนักแสดงต้นแบบเพื่อจับการแสดงสีหน้า การขยับริมฝีปากขณะพูด การยักคิ้วหลิ่วตา แล้วแก้ไขภาพบุคคลเป้าหมายในคลิปวิดีโอให้แสดงสีหน้าและขยับปากตามต้นแบบได้แบบสดๆ

Main menu

Flippy หุ่นยนต์ทำเบอร์เกอร์ ที่ไม่ได้เป็นแค่แขนกลตั้งเวลาย่างเนื้อ

ล้ำไปอีกขั้น Pornhub นำปัญญาประดิษฐ์เข้ามาช่วยจัดการเนื้อหาให้ดียิ่งขึ้น

กูเกิลโชว์งานวิจัย ใช้อัลกอริทึมลบลายน้ำของภาพถ่ายได้แบบง่ายๆ

Facebook เข้าซื้อ Fayteq สตาร์ทอัพ computer vision จากเยอรมนี

วิดีโอก็เชื่อไม่ได้ งานวิจัยสร้างวิดีโอจากเสียงได้อย่างสมจริง

กูเกิลออก MobileNets โมเดลประมวลผล AI ด้วย TensorFlow บนมือถือ กินพลังงานต่ำ

ARM โอเพนซอร์สไลบรารีประมวลผลภาพ, ปัญญาประดิษฐ์

Flickr เปิดตัวฟีเจอร์ค้นหาภาพที่เหมือนกัน โดยใช้ deep neural network ในการวิเคราะห์ภาพ

Apple เผยงานวิจัย AI ชิ้นแรกออกสู่สาธารณะแล้ว เป็นเรื่องเทคโนโลยี computer vision

พร้อมใช้งานในรถและกล้องวงจรปิด กราฟิก PowerVR ผ่านการทดสอบ OpenVX 1.1

อย่างนี้ก็มีด้วย? ชายรัสเซียโดนใบสั่งเพราะเงารถพาดทับเส้นทึบ

อินเทลซื้อ Movidius เจ้าของชิปประมวลผลภาพ Vision Processing Unit (VPU)

ไม่ใช่เรื่องโม้แค่ในหนัง มาดูการทำภาพใบหน้าเบลอๆ แบบโมเสค ให้ชัดขึ้นด้วย AI

งานวิจัย MIT ทำภาพนิ่งให้ตอบสนองการดึง-ดันได้แบบสมจริงโดยไม่ต้องร่างโมเดล 3 มิติ

Faception เมื่อ AI ถูกใช้ระบุผู้ต้องสงสัยก่อการร้ายด้วยการตัดสินจากภาพถ่ายใบหน้า

นักวิจัยสร้าง AI ที่เปลี่ยนภาพถ่ายขาวดำให้กลับมามีสีสันใหม่ได้

อย่าเพิ่งเชื่อที่ตาเห็น! เพราะงานวิจัยใหม่ทำให้แก้ไขภาพปากคนในวิดีโอขยับพูดได้ตามใจชอบ

Pages

About Blognone

Other Version

Copyright Notice

Main menu

You are here

Pages

sign in

About Blognone

Other Version

Copyright Notice