By lew Founder on Tag: OpenCV, Artificial Intelligence, ONNX, Computer Vision
OpenCV

OpenCV ไลบรารีด้านการประมวลผลภาพ (CV - Computer Vision) ออกเวอร์ชัน 5.0 หลังจากออกเวอร์ชัน 4.0 มาตั้งแต่ปี 2018 โดยเวอร์ชั่นนี้แสดงแนวทางว่า OpenCV จะหันไปรองรับมาตรฐาน ONNX มากขึ้น ทำให้รองรับโมเดลรุ่นใหม่ๆ เช่น YOLOv8 รวมถึงโมเดลภาษาอีกด้วย

By mk Founder on Tag: Hertz, Artificial Intelligence, Computer Vision
Hertz

บริษัทรถเช่ารายใหญ่ของโลก เช่น Hertz และ Sixt เริ่มนำเทคโนโลยีที่เรียกว่า Digital Vehicle Inspection (DVI) หรือ Car Gate (ชื่อแล้วแต่ค่ายจะเรียก) มาใช้ตรวจสภาพรถเช่าตอนคืนรถ เพื่อลดความล่าช้าของการตรวจด้วยเจ้าหน้าที่

ปัญหาสำคัญอย่างหนึ่งของรถเช่าคือ ตอนคืนรถจะต้องรอเจ้าหน้าที่ตรวจสภาพรถยนต์ว่ามีความเสียหายอะไรบ้าง ซึ่งใช้เวลานาน, อาจต้องรอคิว และมีเวลาทำการของเจ้าหน้าที่

เทคโนโลยี Digital Vehicle Inspection เป็นประตูขนาดใหญ่ที่ขับรถเข้าไปแล้วสแกนรอบตัวรถ และใช้เทคนิค computer vision กับ AI ตรวจสภาพรถ เทียบกับข้อมูลสภาพรถที่สแกนเก็บไว้ก่อนหน้านี้ เพื่อหาความเสียหายได้ทันที

By arjin Writer on Tag: Intel, RealSense, Computer Vision
Intel

RealSense บริษัทด้าน Computer Vision ซึ่งเคยอยู่ภายใต้อินเทล ประกาศว่าบริษัทได้แยกออกมาเป็นอิสระจากอินเทลเสร็จสมบูรณ์แล้ว ตามแผนการที่ประกาศก่อนหน้านี้ โดยบริษัทได้รับเงินลงทุนซีรีส์ A รวม 50 ล้านดอลลาร์ จากกลุ่มนักลงทุนนำโดย MediaTek และ Intel Capital ที่เป็นหน่วยงานการลงทุนของอินเทลเอง

RealSense บอกว่าจากนี้บริษัทจะมุ่งเน้นการพัฒนาด้าน AI, หุ่นยนต์, Biometrics และ Computer Vision ซึ่งที่ผ่านมาสินค้าของบริษัทถูกนำไปใช้งานทั้งหุ่นยนต์หลากหลายรูปแบบ และระบบยืนยันตัวตนด้วยอัตลักษณ์ ซึ่งต่างเป็นตลาดที่ยังมีการเติบโตสูง โดยเฉพาะการมาของ AI ที่ทำให้การนำไปใช้งานของฝั่งองค์กรมีเพิ่มมากขึ้น

By arjin Writer on Tag: Grok, xAI, Artificial Intelligence, Computer Vision
Grok

xAI ประกาศเพิ่มความสามารถใหม่ให้ปัญญาประดิษฐ์ Grok ในชื่อ Grok Vision ให้ผู้ใช้งานถามข้อมูลจากสิ่งที่ปรากฏตรงหน้าในกล้องโทรศัพท์ ตอนนี้รองรับเฉพาะแอป Grok ใน iOS ส่วน Android ไม่ได้บอกว่าจะมาเมื่อใด

นอกจากนี้ Grok ยังเพิ่มความสามารถรองรับอินพุทเสียงในหลายภาษา และค้นหาข้อมูลได้ทันทีในโหมด Voice ฟีเจอร์นี้ได้เฉพาะลูกค้าที่สมัครแผน SuperGrok

Grok เป็นอีกบริการปัญญาประดิษฐ์ที่เพิ่มฟีเจอร์ใหม่ต่อเนื่อง เมื่อสัปดาห์ที่แล้วได้เพิ่ม Memory ที่จดจำข้อมูลพื้นฐานของผู้ใช้งาน

By mk Founder on Tag: Runway, Artificial Intelligence, Computer Vision
Runway

Runway สตาร์ตอัพผู้พัฒนา AI สร้างวิดีโอ เปิดตัวโมเดลเวอร์ชันใหม่ Runway Gen-4 ที่มีความสามารถเพิ่มขึ้นจากเดิมมาก โมเดลสามารถทำงานตามคำสั่งของผู้ใช้ได้อย่างเจาะจงแม่นยำ และมีความสม่ำเสมอ (consistency) สูง เพื่อให้การใช้งานระดับโปรดักชันจริงสามารถนำไปใช้ได้แบบไร้กังวล

By mk Founder on Tag: Samsung, Home Appliance, Computer Vision
Samsung

เราเห็น "ตู้เย็นมีจอภาพ" กันมาได้สักพักใหญ่ๆ แล้ว ซัมซุงเคยออกตู้เย็นที่มีจอใหญ่ถึง 32" มาตั้งแต่ปี 2023 พัฒนาล่าสุดของตู้เย็นในยุค AI ครองเมืองย่อมหนีไม่พ้น "ตู้เย็นมีจอภาพ AI"

สิ่งที่น่าสนใจคือจอภาพ AI Home แบบใหม่มีขนาดเล็กลงเหลือ 9" เท่านั้น (แต่จะเลือกจอ Family Hub แบบเดิมขนาด 21.5" หรือ 32" ก็ยังมีให้เลือกซื้อแบบคัสตอมได้) ฟีเจอร์ใหม่ของหน้าจอ AI คือความสามารถที่เพิ่มขึ้น มีฟีเจอร์ AI Vision Inside แยกแยะวัตถุในตู้เย็นได้แม่นยำกว่าเดิม ตั้งชื่อให้สิ่งของในตู้เย็นได้ จดจำได้ว่าของอันไหนเราเอาเข้าๆ ออกๆ ตู้เย็นบ่อยๆ

Artificial Intelligence

AlexNet ซอฟต์แวร์แยกแยะรูปภาพที่เคยเป็นจุดเปลี่ยนสำคัญของวงการ AI เมื่อปี 2012 ตอนนี้เปิดซอร์สโค้ดต่อสาธารณะ เข้าถึงได้บน GitHub

AlexNet พัฒนาโดย Alex Krizhevsky นักศึกษาปริญญาเอกชาวยูเครนที่มหาวิทยาลัย Toronto ในขณะนั้น ร่วมกับเพื่อนนักศึกษา Ilya Sutskever (ภายหลังเป็นผู้ร่วมก่อตั้ง OpenAI) และอาจารย์ของพวกเขาคือ Geoffrey Hinton (หลังจากนั้นแบ่งเวลาบางส่วนไปทำงานกับกูเกิลจนถึงปี 2023 และได้รางวัลโนเบลสาขาฟิสิกส์ในปี 2024)

By Virusfowl Contributor on Tag: Be My Eyes, Accessibility, Computer Vision
Be My Eyes

Be My Eyes แอปพลิเคชันที่ช่วยเหลือผู้มีความบกพร่องทางการมองเห็น ร่วมมือกับ Knorr Thailand เปิดตัวฟีเจอร์ใหม่ ช่วยให้ผู้ใช้เข้าถึงข้อมูลบนบรรจุภัณฑ์ผลิตภัณฑ์ Knorr การสแกน QR โค้ด ผ่านแอป Be My Eyes

ฟีเจอร์นี้ใช้เทคโนโลยี Be My AI อ่านข้อมูลเกี่ยวกับส่วนผสม, คุณค่าทางโภชนาการ และวิธีการปรุงอาหารแบบเสียงให้ผู้ใช้ได้ยินทันทีในภาษาไทย

ผู้ใช้ยังสามารถติดต่อ เจ้าหน้าที่ Knorr ผ่านวิดีโอคอลล์เพื่อขอคำแนะนำเพิ่มเติม ในกรณีที่ต้องการความช่วยเหลือแบบทันที

By arjin Writer on Tag: Amazon, Artificial Intelligence, Computer Vision, Logistics
Amazon

Amazon เปิดตัวเครื่องมือใหม่เพื่อแก้ปัญหาให้กับพนักงานส่งสินค้า ที่ต้องใช้เวลาหลายนาทีค้นหาพัสดุในรถ ขณะที่รถจอดอยู่บริเวณสถานที่ซึ่งกำลังจะเข้าไปส่ง

โซลูชันใหม่มีชื่อว่า Vision-Assisted Package Retrieval (VAPR) ซึ่งลดขั้นตอนแมนนวลเดิม ที่คนส่งสินค้าต้องเริ่มจากการจัดพัสดุในรถให้เป็นไปตามจุดจอดตามแผน เทียบใบส่งของ เมื่อไปถึงสถานที่ก็ค้นหาและดูพัสดุซ้ำอีกครั้งก่อนทำการส่ง แต่ VAPR ทำงานแบบนับ 1-2-3 พนักงานส่งสินค้าเพียงดูว่าไฟเขียวชี้ลงที่พัสดุอันไหน ก็หยิบแล้วไปส่งได้เลย

By arjin Writer on Tag: MIT, Robotics, Computer Vision
MIT

หน่วยงาน Computer Science and Artificial Intelligence Laboratory (CSAIL) ของ MIT เผยแพร่งานวิจัยด้านหุ่นยนต์เรียกชื่อว่า RoboGrocery ซึ่งมีความสามารถในการแยกแยะ จับสิ่งของ และจัดเรียงลงในกล่องอย่างเหมาะสม

เทคโนโลยีที่ใช้มีทั้งส่วนการมองเห็นเพื่อแยกแยะวัตถุ ระบบแขนกลจับแบบอ่อนที่ส่งข้อมูลกลับ เพื่อประเมินว่าเป็นวัตถุที่บอบบางหรือไม่ (ในการทดสอบนี้ใช้พวงองุ่น) และอัลกอริทึมจัดเรียง เช่น ถ้าเป็นพวงองุ่น ให้แยกรอไว้ก่อน เพื่อวางของมีน้ำหนัก เช่น ซุปกระป๋อง ลงกล่องด้านล่างก่อน

Amazon

Amazon เผยรายละเอียดของ Project P.I. (ย่อมาจาก Private Investigator) เป็นการนำเทคนิค computer vision เข้ามาช่วยสแกนสินค้าว่าเสียหายหรือไม่ ก่อนบรรจุลงกล่องส่งไปหาลูกค้า เพื่ิอลดการคืนสินค้าหรือคำร้องเรียนจากลูกค้าลง

สินค้าที่อยู่ในโกดังของ Amazon ก่อนจัดส่งจะถูกส่งเข้า image tunnel เพื่อถ่ายภาพ แล้วให้ Project P.I. ช่วยวิเคราะห์ความบกพร่องชนิดต่างๆ (เช่น ปกหนังสือยับ) แล้วแจ้งเตือนไปยังเจ้าหน้าที่มนุษย์ เพื่อตัดสินใจว่าควรทำอย่างไรกับสินค้าที่มีปัญหานั้น เช่น นำไปขายเป็นสินค้ามือสอง (Amazon Second Chance) หรือบริจาค

Accessibility

จากราวหนึ่งปีก่อน ที่แอพช่วยเหลือผู้มีปัญหาทางสายตาอย่าง Be My Eyes ได้ เพิ่มผู้ช่วยอัจฉริยะ พลัง A.I. เข้ามา แต่แอพพลิเคชันยังสามารถใช้งานได้จากบน mobile device เท่านั้น ล่าสุด Be My Eyes ได้เปิดตัวฟีเจอร์ผู้ช่วยอัจฉริยะที่เป็นแอพพลิเคชันบนระบบปฏิบัติการวินโดส์แล้ว โดยสามารถติดตั้งได้จาก Microsoft store

เมื่อเปิดโปรแกรมและล็อกอินเรียบร้อยแล้ว หน้าต่างหลักของโปรแกรมจะมีฟีเจอร์ให้เราเลือกใช้งานอยู่ 4 เมนู ได้แก่

By arjin Writer on Tag: F1, Artificial Intelligence, Sport, Computer Vision
F1

FIA ผู้จัดการแข่งขันรถ F1 เปิดเผยว่าจะทดสอบการนำ AI มาช่วยในการตัดสิน Track Limit หรือปัญหารถขับออกนอกเส้นแทร็กสนาม โดยจะนำมาใช้ในการแข่งขันรายการอาบูดาบี กรังด์ปรีซ์ ซึ่งเป็นสนามสุดท้ายของฤดูกาลที่จะแข่งในสุดสัปดาห์นี้

เทคโนโลยีที่นำมาใช้คือ Computer Vision ทำงานร่วมกับ AI พิจารณาว่ารถแข่งขันออกนอกเส้นแทร็กสนามหรือไม่ที่ระดับพิกเซล เมื่อตรวจพบรถที่ขับออกนอกแทร็กทั้ง 4 ล้อ ระบบจะส่งรายงานให้ Steward หรือกรรมการดูแลการแข่งขันพิจารณาความผิดอีกครั้ง

By arjin Writer on Tag: Amazon, Logistics, Artificial Intelligence, Computer Vision
Amazon

Amazon ประกาศความร่วมมือกับ UVeye พัฒนาระบบตรวจสอบยานพาหนะอัตโนมัติ AVI (Automated Vehicle Inspection) เพื่อใช้ตรวจสอบความผิดปกติและสภาพความปลอดภัยของรถขนส่งพัสดุ ซึ่งเดิมเป็นงานที่ใช้คน

UVeye เป็นสตาร์ทอัพจากอิสราเอลที่เชี่ยวชาญการทำระบบตรวจจับความผิดปกติของรถสำหรับงานความปลอดภัย ใช้ในพื้นที่พรมแดนระหว่างประเทศหรือในอาคาร ซึ่งต่อมาพัฒนาเป็นระบบตรวจจับความผิดปกติสำหรับรถทั่วไป

By arjin Writer on Tag: Alibaba Cloud, Alibaba, Artificial Intelligence, Computer Vision
Alibaba Cloud

Alibaba Cloud เปิดตัวโมเดลภาษาภาพขนาดใหญ่ (Large Vision Language) แบบโอเพนซอร์ส ซึ่งมีความสามารถในการเข้าใจภาพและตัวหนังสือ

สองโมเดลได้แก่ Qwen-VL เป็นโมเดลภาษาภาพขนาดใหญ่ที่ถูกเทรนมาก่อน และ Qwen-VL-Chat โมเดลสำหรับการสนทนาโต้ตอบ ขนาด 7 พันล้านพารามิเตอร์ มีความสามารถทำความเข้าใจภาพในภาษาอังกฤษและภาษาจีน และสร้างบทสนทนาโต้ตอบ รวมถึงทำงานประมวลผล เช่น บวกเลขในภาพได้ ซึ่งสามารถนำมาช่วยทั้งการอ่านป้ายภาษาจีน สำหรับคนที่ไม่รู้ภาษาจีน หรือใช้ช่วยอ่านป้ายต่าง ๆ สำหรับผู้มีปัญหาการมองเห็น

By arjin Writer on Tag: Amazon, Contactless Payment, Computer Vision
Amazon

บริการระบบจ่ายเงินด้วยฝ่ามือ Amazon One ประกาศเพิ่มคุณสมบัติใหม่ โดยนอกจากใช้จ่ายเงินได้แล้ว ยังสามารถใช้ยืนยันอายุของผู้ซื้อ สำหรับการซื้อเครื่องดื่มแอลกอฮอล์ได้ด้วย จากเดิมในขั้นตอนนี้ผู้ซื้อต้องแสดงเอกสารที่ออกให้โดยหน่วยงานรัฐทุกครั้ง

By arjin Writer on Tag: Meta, Computer Vision, Artificial Intelligence
Meta

Meta เผยแพร่โครงการ Segment Anything โมเดล AI สำหรับงานแยกแยะวัตถุในรูปภาพและวิดีโอ (Segmentation) มีจุดเด่นคือความสามารถในการแยกแยะวัตถุต่าง ๆ แม้จะไม่เคยเทรนให้รู้จักวัตถุนั้นมาก่อน และมาพร้อมเครื่องมือที่วาดเส้นขอบวัตถุให้อัตโนมัติ

Accessibility

Be My Eyes แอปช่วยเหลือสำหรับผู้มีปัญหาด้านการมองเห็น ซึ่งใช้การวิดีโอคอลขอความช่วยเหลือจากอาสาสมัคร ประกาศเพิ่มความสามารถใหม่โดยใช้โมเดล GPT-4 ของ OpenAI ที่เพิ่งเปิดตัวไป

ฟีเจอร์ใหม่ที่เพิ่มมาด้วยความสามารถของ AI นี้ เรียกชื่อว่า Virtual Volunteer มีเป้าหมายให้ทำงานได้ในระดับเดียวกับอาสาสมัคร โดยสามารถให้รายละเอียดของภาพที่เห็น พร้อมคำแนะนำเพิ่มเติมที่เกี่ยวเนื่อง ซึ่งเป็นความสามารถใหม่เพิ่มเติมของ GPT-4

Artificial Intelligence

Tamás Nemes เป็นเด็กหนุ่มชาวเยอรมันวัยเพียง 18 ปี สิ่งที่ทำให้เขาเป็นที่รู้จักในระดับประเทศคือผลงานการประดิษฐ์กล้องห้อยคอที่มาพร้อมระบบ computer vision ที่ใช้ปัญญาประดิษฐ์ช่วยจำแนกสิ่งที่กล้องมองเห็นและจำแนกวัตถุในภาพเหล่านั้น

การจำแนกวัตถุจากภาพของกล้องนั้นทำไปเพื่อบอกเสียงแจ้งเตือนแก่ผู้ใช้ซึ่งมีปัญหาด้านการมองเห็นให้ได้รับรู้ว่ามีกีดขวางอะไรอยู่รอบตัวผู้ใช้บ้าง และช่วยให้เข้าใจสภาพแวดล้อมโดยรอบได้ดีขึ้น

Artificial Intelligence

ทีมนักวิจัยจาก Cornell University พัฒนาอัลกอริทึมของปัญญาประดิษฐ์เพื่อศึกษาเทปการแข่งขันกีฬาวอลเลย์บอล จนทำให้มันเข้าใจเกมและสามารถทำนายการเคลื่อนที่ของผู้เล่น และวิธีการที่ผู้เล่นจะเลือกใช้ในจังหวะต่อไปได้แม่นยำเกิน 80%

การทำงานของอัลกอริทึมจะอาศัยข้อมูลรอบด้านเพื่อทำนายการเคลื่อนที่หรือการตัดสินเลือกวิธีการเล่นของผู้เล่นในสนาม โดยอาศัยทั้งข้อมูลจากระบบ computer vision ควบคู่ไปกับข้อมูลที่มีการป้อนให้แก่ปัญญาประดิษฐ์โดยตรง เพื่อให้ระบบปัญญาประดิษฐ์เข้าใจข้อมูลแวดล้อมของการแข่งขันเพื่อใช้ประกอบการทำนายได้แม่นยำยิ่งขึ้น

Subscribe to Computer Vision