By arjin Writer on Tag: Apple, Artificial Intelligence, Image Processing, 3D
Apple

ทีมวิจัยปัญญาประดิษฐ์ของแอปเปิล เผยแพร่งานวิจัย Depth Pro โมเดล AI ที่สามารถสร้างแผนที่ความลึกของรูปภาพแบบสามมิติ จากอินพุทที่เป็นรูปภาพสองมิติได้ในเวลาไม่ถึงหนึ่งวินาที โดยไม่ต้องอาศัยข้อมูลเพิ่มเติมของกล้องที่บันทึกภาพ

โมเดล Depth Pro ทำงานโดยอาศัยการคาดเดาความลึกของภาพ ผ่านการเทรนด้วยชุดข้อมูลที่เป็นภาพความละเอียดสูง ทำให้สามารถแยกแยะขอบแต่ละวัตถุ ออกมาเป็นการให้ระดับความลึกแต่ละตำแหน่งได้เลยจากภาพ

Artificial Intelligence

Emil Wallner นักวิจัยปัญญาประดิษฐ์ได้สร้างเว็บไซต์ Palette.fm ซึ่งมีระบบปัญญาประดิษฐ์ที่เขาพัฒนาขึ้น สามารถเปลี่ยนภาพขาวดำที่ถูกอัพโหลดขึ้นไป ให้กลายเป็นภาพสีได้ภายในคลิกเดียว นอกจากนี้ผู้ใช้ยังสามารถแก้ไขข้อความบรรยายภาพเพื่อปรับแต่งภาพสีที่ได้ให้มีลักษณะตรงความต้องการได้มากขึ้นด้วย

Pellete.fm จะเรียนรู้วัตถุในภาพที่มันได้รับและทายว่าวัตถุนั้นมีสีอะไรตามธรรมชาติโดยอาศัยข้อมูลจากที่มันได้รับการเทรนมา Wallner อธิบายว่าเขาสร้างโมเดลปัญญาประดิษฐ์ขึ้นมา 2 โมเดล โมเดลแรกจะดูภาพและสร้างข้อความบรรยายภาพนั้นขึ้นมา ส่วนโมเดลที่ 2 จะใช้ข้อความที่ถูกสร้างขึ้นประกอบกับภาพขาวดำที่ถูกป้อนให้มันมาประมวลรวมกันเพื่อเปลี่ยนภาพดังกล่าวให้เป็นภาพสี

By arjin Writer on Tag: Apple, Image Processing, Acquisition
Apple

มีรายงานว่าแอปเปิลได้ซื้อกิจการสตาร์ทอัพจากอังกฤษ Spectral Edge ด้วยมูลค่าที่ไม่เปิดเผย อย่างไรก็ตามแอปเปิลไม่ได้ออกมายืนยันถึงดีลดังกล่าวแบบในอดีต แต่สำนักข่าว Bloomberg ยืนยันแหล่งข่าวและเอกสารว่าดีลนี้เกิดขึ้นแล้ว

Spectral Edge เป็นผู้พัฒนาอัลกอริทึมสำหรับปรับปรุงภาพถ่ายให้มีความคมชัดมากขึ้น มีสีที่ถูกต้องมากขึ้น ในระดับเรียลไทม์ คาดว่าแอปเปิลจะนำเทคนิคนี้มาใช้กับกล้องของ iPhone

ที่มา: 9to5Mac

By lew Founder on Tag: Image Processing, Research, Gender
Image Processing

ภาพ Lena Söderberg นางแบบนิตยสาร Playboy ที่ตีพิมพ์เป็นภาพกลางเล่มนิตยสารฉบับพฤศจิกายน 1972 และในปี 1973 ระหว่างทีมวิจัยใน University of Southern California กำลังพัฒนาอัลกอริธึมในการบีบอัดภาพที่เป็นต้นกำเนิดของ JPEG ทีมวิจัยก็ตัดสินใจใช้ภาพกลางเล่มนิตยสาร Playboy วันนี้สารคดี Losing Lena แสดงปัญหาว่าการใช้ภาพ Lena โดยไม่ได้ใส่ใจ ส่งผลต่อการผลักดันผู้หญิงออกจากวงการวิทยาการศาสตร์อย่างไร

By arjin Writer on Tag: Apple, Image Processing, Acquisition, Augmented Reality
Apple

มีรายงานจากสื่อในเดนมาร์ก ว่าแอปเปิลได้เข้าซื้อกิจการสตาร์ทอัพ Spektral ซึ่งเชี่ยวชาญการทำ Machine Learning ตัดและซ้อนภาพฉากหลัง (Green Screen) แบบเรียลไทม์ โดยดีลดังกล่าวมีมูลค่าราว 30 ล้านดอลลาร์ และปิดดีลกันไปตั้งแต่ปีที่แล้ว

Toke Jansen หนึ่งในผู้ร่วมก่อตั้ง ปัจจุบันมีตำแหน่งเป็นผู้จัดการฝ่าย Computational Imaging ที่แอปเปิล

Spektral เป็นสตาร์ทอัพที่เน้นด้านเทคโนโลยีการแยกวัตถุหลักออกจากพื้นหลังในวิดีโอ ซึ่งสามารถทำงานได้ถึงระดับ 60fps นอกจากนี้ยังสามารถซ้อนภาพฉากหลังอื่นเข้ามาแทนที่ เหมือนกับเทคโนโลยีฉากหลังสีเขียวในรายการโทรทัศน์

By nutmos Writer on Tag: Artificial Intelligence, Image Processing, Research, NVIDIA, MIT
Artificial Intelligence

นักวิจัยจาก Nvidia, MIT และ Aalto University ได้ร่วมกันพัฒนาระบบจัดการลบสัญญาณรบกวนหรือน้อยส์จากภาพถ่ายโดยใช้ AI จากการใช้ ImageNet จำนวนกว่า 5 หมื่นภาพ, ภาพถ่ายที่ถูกสร้างขึ้นจากคอมพิวเตอร์และ MRI เป็น dataset สำหรับใช้เทรน ซึ่งตัว AI นี้สามารถจัดการกับน้อยส์และให้ภาพถ่ายที่มีคุณภาพที่ดีออกมาได้

Facebook

Facebook เผยแพร่งานวิจัย ของระบบในการแก้ไขภาพถ่าย ที่ผู้ถูกถ่ายภาพเผลอหลับตา โดยสามารถเติมดวงตาเข้าไปได้ด้วย AI อาศัยข้อมูลพื้นฐานจากภาพถ่ายอื่นประกอบ ซึ่งแตกต่างจากงานแก้ไขภาพแบบอื่น ที่มักอาศัยองค์ประกอบโดยรอบในภาพ แต่หากคนในภาพหลับตาแล้ว ก็จำเป็นต้องใช้ข้อมูลอดีตมาช่วย

วิธีการแก้ไขภาพนี้อาศัยเครือข่ายแบบ Generative Adversarial Networks (GAN) ทำให้เรียนรู้ได้ว่าดวงตาที่ควรนำไปใส่ในภาพที่ต้องการแก้ไข เป็นของใคร และควรปรับสี และรูปทรงให้เข้าภาพนั้นอย่างไร

Google

Google พัฒนาปัญญาประดิษฐ์ให้วิเคราะห์ภาพจากกล้องจุลทรรศน์ ด้วยการเรียนรู้ภาพเนื้อเยื่อเซลล์มะเร็งที่ผ่านการวินิจฉัยจากแพทย์มาแล้วมากมาย มันสามารถมองภาพที่ถ่ายมาใหม่ๆ แล้วแยกแยะได้ว่าตรงไหนเป็นเนื้อร้ายที่กลายเป็นเซลล์มะเร็ง หรือเนื้อเยื่อส่วนไหนที่มีความผิดปกติ

By mk Founder on Tag: Intel, Artificial Intelligence, CPU, Processor, Image Processing
Intel

ปีที่แล้ว อินเทลซื้อ Movidius เจ้าของชิปประมวลผลภาพ Vision Processing Unit (VPU) วันนี้ชิปตัวนี้เปิดตัวอย่างเป็นทางการในชื่อว่า Movidius Myriad X

Myriad X เป็น SoC ที่มีเอนจิน Neural Compute Engine แยกเฉพาะสำหรับงานประมวลผล deep learning ที่ระดับฮาร์ดแวร์ ช่วยให้ประสิทธิภาพงาน deep learning เพิ่มสูงขึ้น (ที่ระดับ 1 TOPS - trillion operations per second) โดยยังรักษาคุณสมบัติเรื่องประหยัดพลังงานเอาไว้

Computer Vision

คงจะเคยดูหนังหรือละครต่างประเทศแนวสืบสวนสอบสวนกันมาบ้าง หลายครั้งที่เราเห็นฉากการตามหาคนแล้วดึงภาพมาจากกล้องวงจรปิด หรือกล้องมือถือที่ไหนสักแห่งแล้วเห็นภาพบุคคลเป้าหมายเบลอๆ เห็นแค่เม็ดพิกเซลเหมือนภาพโมเสค จากนั้นเจ้าหน้าที่ก็ซูมภาพ ซูมแล้วซูมอีก แล้วใช้ซอฟต์แวร์ปรับแต่งภาพให้มีความคมชัดขึ้น จากภาพเบลอๆ เหลี่ยมๆ ก็กลายเป็นภาพใบหน้าคนที่มีความคมชัดขึ้น วันนี้อยากบอกให้รู้ว่าเรื่องพวกนี้มันไม่ได้ขี้โม้เกินจริงสักเท่าไหร่เลย ตัวอย่างโปรแกรมของชายที่ชื่อ David Garcia พิสูจน์เรื่องนี้ให้เห็นได้อย่างดี

Google

Google พัฒนา PlaNet ปัญญาประดิษฐ์ที่สามารถเดาได้ว่าภาพถ่ายที่มันเห็นถูกถ่ายจากที่ไหนบนโลก โดยอาศัยข้อมูลจากสิ่งที่ปรากฏในภาพเท่านั้น ไม่ต้องใช้ข้อมูลแท็กสถานที่ (geotag) ของภาพถ่าย

Tobias Weyand ผู้เชี่ยวชาญด้านคอมพิวเตอร์วิทัศน์ของ Google คือผู้นำทีมในการพัฒนา PlaNet พวกเขาสอนให้มันรู้จักภาพถ่ายจากสารพัดสถานที่กระจายกันรอบโลกถึง 126 ล้านภาพ ซึ่งผลลัพธ์ที่ได้ก็ทำให้ PlaNet สามารถระบุสถานที่ที่แต่ละภาพถูกถ่ายมาได้แม่นยำกว่าคนมาก

By mk Founder on Tag: Google, Image Processing, Google Cloud, Image Recognition
Google

ปลายปีที่แล้ว กูเกิลเปิดให้นักพัฒนาภายนอกบริษัทเข้าถึงฟีเจอร์การแยกแยะรูปภาพแบบเดียวกับใน Google Photos โดยใช้ชื่อว่า Cloud Vision API แต่ยังจำกัดการทดสอบเฉพาะกลุ่มอยู่

วันนี้กูเกิลเปิดให้ใครก็ได้ที่สนใจ สามารถเขียนโปรแกรมส่งภาพผ่าน API เพื่อให้ระบบปัญญาประดิษฐ์แยกแยะภาพได้แล้ว รวมถึงประกาศราคาค่าใช้งาน โดยคนที่ใช้ต่ำกว่า 1,000 ภาพต่อเดือนสามารถใช้ได้ฟรี ถ้าใช้มากกว่านั้นเริ่มต้นที่ 2.5 ดอลลาร์ต่อ 1,000 ภาพต่อเดือน (ราคาขึ้นกับว่าแยกแยะหาข้อมูลอะไรในภาพ)

By lew Founder on Tag: Japan, Omron, Image Processing, Image Recognition
Japan

Omron เปิดตัวโครงการ Sensing Egg ชุดกล้องวงจรปิดที่มี API ระดับสูงให้นักพัฒนาภายนอกสามารถพัฒนาแอพพลิเคชั่นใหม่ๆ ลงไปได้

API ที่มีในกล้องชุดนี้ได้แก่ ตรวจจับใบหน้า, จดจำใบหน้า, คาดเดาเพศ, คาดเดาอายุ, วัดอารมณ์จากใบหน้า, ทิศทางการหัน, ทิศทางสายตา, ตำแหน่งของตา, ตรวจจับมือ, ตรวจจับร่างกายคนในภาพ, ตรวจจับสัตว์เลี้ยงและจดจำใบหน้าสัตว์เลี้ยง

ตัวกล้องมาพร้อมกับ SDK ให้นักพัฒนาภายนอกช่วยกันคิดว่าจะใช้ความสามารถเหล่านี้ทำอะไรได้บ้าง โดยทาง Omron พัฒนาแอพพลิเคชั่นสองตัวมาพร้อมกับกล้อง ได้แก่

Google

งานวิจัยของ MIT ที่ได้รับความร่วมมือจาก Google อาจกลายเป็นหนึ่งฟีเจอร์สำคัญของกล้องและสมาร์ทโฟนในอนาคต ด้วยการใช้อัลกอริทึมของงานวิจัยนี้ ทำให้การถ่ายภาพหน้ารั้วตาข่าย หรือถ่ายวิวนอกห้องผ่านกระจกหน้าต่าง จะได้ภาพชัดที่ไม่ถูกบดบังด้วยภาพของรั้วหรือเงาสะท้อนในกระจกอีกต่อไป

By mk Founder on Tag: Image Processing, Machine Learning, Microsoft, Microsoft Azure
Image Processing

เดือนที่แล้วไมโครซอฟท์สร้างความฮือฮาไปทั่วโลกด้วยเว็บ How-Old.net อัพโหลดภาพเพื่อทายอายุ (ซึ่งเป้าหมายจริงๆ คือโชว์ความสามารถของ Azure Machine Learning)

เดือนนี้ไมโครซอฟท์กลับมาอีกครั้งกับเว็บคล้ายๆ กันชื่อ TwinsOrNot.net อัพโหลดภาพไป 2 ภาพเพื่อตรวจสอบว่าเป็นฝาแฝดกันหรือไม่

By ตะโร่งโต้ง Writer on Tag: Research, Image Processing, Microsoft
Research

จำได้ไหม? พวกเราจำได้ใช่ไหม? ปีที่แล้ว Google เผยแพร่งานวิจัยการใช้โครงข่ายประสาทเทียมที่เรียนรู้จนสามารถแยกแยะวัตถุที่เห็นในภาพต่างๆ ได้ ล่าสุด Microsoft ก็โชว์ผลงานลักษณะเดียวกันนี้ให้เห็นบ้าง โดย Microsoft อ้างว่านี่เป็นครั้งแรกที่ระบบซอฟต์แวร์สามารถเอาชนะมนุษย์ได้สำเร็จในการแยกแยะวัตถุในภาพ

By nuntawat Writer on Tag: Application, Image Processing, Microsoft
Application

ไมโครซอฟท์ รีเสิร์ช อัพเดต Image Composite Editor (ICE) แอพทำภาพพาโนรามา จากรุ่น 1.4.4 เป็นรุ่น 2.0 โดยแอพรุ่นล่าสุดมากับส่วนติดต่อผู้ใช้ (UI) ใหม่หมด เพิ่ม Image Autocomplete ฟีเจอร์เติมเต็มส่วนของภาพที่หายไปหลังการรวมภาพ (ดูภาพเปรียบเทียบที่ท้ายข่าวประกอบ) และฟีเจอร์ทำภาพพาโนรามาจากวิดีโอ สนับสนุนซีพียู 64 บิต เป็นต้น

ดูคลิปนำเสนอแอพได้ที่ท้ายข่าว และดาวน์โหลดแอพได้จากที่มาของข่าวครับ

ที่มา: WinBeta

Google

ผลของการจับเอางานวิจัยด้านการรู้จำและแยกแยะวัตถุในภาพของ Google มารวมพลังกับงานวิจัยด้านภาษาธรรมชาติของ Stanford ทำให้ได้ระบบซอฟต์แวร์ที่สามารถทำความเข้าใจองค์ประกอบของภาพถ่าย และบรรยายออกมาเป็นประโยคด้วยถ้อยคำที่เป็นธรรมชาติ

OCR

ไมโครซอฟท์มีแอพชื่อ Office Lens บน Windows Phone ใช้สำหรับถ่ายภาพเอกสารแล้วแปลงเป็นโน้ตของ OneNote (ข่าวเก่า) ล่าสุดไมโครซอฟท์อัพเกรดความสามารถของมันเพิ่มเติม ให้สามารถถ่ายภาพเอกสารแล้วแปลงเป็นไฟล์ Word หรือ PowerPoint ได้ด้วย

หลักการทำงานของมันคือใช้เทคนิค image processing ช่วยแปลงเอกสารที่อาจถ่ายมุมเอียง กลับมาเป็นเอกสารที่ถูกสแกนมาแบบแนวราบ จากนั้นใช้เทคนิค OCR แปลงข้อความบนเอกสารเป็นไฟล์ข้อความ โดยยังคงรักษาฟอร์แมตของเอกสารเอาไว้ (ทำได้แม้กระทั่งตาราง) แนะนำให้ดูภาพและวิดีโอประกอบ

Google

เทคโนโลยีการใช้ระบบคอมพิวเตอร์มาจดจำภาพใบหน้าของมนุษย์เพื่อแยกแยะจำแนกบุคคลนั้นว่าน่าทึ่งแล้ว แต่เทคโนโลยีในห้องวิจัยนั้นยังคงเดินหน้าต่อไปเรื่อยจนถึงขนาดที่ว่าระบบคอมพิวเตอร์สามารถระบุได้ว่าวัตถุต่างๆ ที่ปรากฏในภาพถ่ายที่มันมองเห็นนั้นคืออะไร

Subscribe to Image Processing