Tamás Nemes เป็นเด็กหนุ่มชาวเยอรมันวัยเพียง 18 ปี สิ่งที่ทำให้เขาเป็นที่รู้จักในระดับประเทศคือผลงานการประดิษฐ์กล้องห้อยคอที่มาพร้อมระบบ computer vision ที่ใช้ปัญญาประดิษฐ์ช่วยจำแนกสิ่งที่กล้องมองเห็นและจำแนกวัตถุในภาพเหล่านั้น
การจำแนกวัตถุจากภาพของกล้องนั้นทำไปเพื่อบอกเสียงแจ้งเตือนแก่ผู้ใช้ซึ่งมีปัญหาด้านการมองเห็นให้ได้รับรู้ว่ามีกีดขวางอะไรอยู่รอบตัวผู้ใช้บ้าง และช่วยให้เข้าใจสภาพแวดล้อมโดยรอบได้ดีขึ้น
Tamás Nemes (คนสวมเสื้อแดง) กับอาสาสมัครผู้ร่วมทดสอบใช้งานสิ่งประดิษฐ์ของเขา
Nemes ตั้งชื่อสิ่งประดิษฐ์ของเขาว่า GUIDE-Walk โดยในปัจจุบันเขาได้พัฒนามันมาเป็นรุ่น 2.0 แล้ว ตัวอุปกรณ์ใช้ปัญญาประดิษฐ์ที่ชื่อ Gabrielle ช่วยในการจำแนกแยกแยะวัตถุที่กล้องจับภาพได้ เพื่อนำมาบอกแก่ผู้ใช้ด้วยเสียงพูดสังเคราะห์ผ่านหูฟังแบบอาศัยการสั่นสะเทือนผ่านกระดูก
ตัวอุปกรณ์หลักส่วนที่เป็นกล่องห้อยคอผู้ใช้นั้นภายในมีกล้องบันทึกภาพที่มีเซ็นเซอร์รับภาพของกล้องสามารถจับภาพขนาด 1280*720 พิกเซล บันทึกภาพได้ 30 เฟรมต่อวินาที ภาพที่ถูกกล้องถ่ายไว้ได้จะถูกส่งให้ปัญญาประดิษฐ์ทำการจำแนกวัตถุในภาพแบบเรียลไทม์
ภายในกล่องอุปกรณ์หลักของ GUIDE-Walk ซึ่งเป็นที่ติดตั้งกล้องยังมีเซ็นเซอร์ LIDAR ช่วยตรวจจับวัตถุโดยรอบผู้ใช้ หากผู้ใช้เดินเข้าใกล้สิ่งกีดขวางที่อยู่ตรงหน้าซึ่ง LIDAR ตรวจจับได้ มันจะส่งเสียงร้องเตือนผู้ใช้เพื่อบอกให้ระวังสิ่งกีดขวางตรงหน้า นอกจากนี้ยังมีชุดเซ็นเซอร์ตรวจจับการเคลื่อนไหวที่ประกอบไปด้วยเซ็นเซอร์วัดอัตราเร่ง, ไจโรสโคป, เซ็นเซอร์วัดค่าสนามแม่เหล็ก, เซ็นเซอร์วัดอุณหภูมิ รวมทั้งเซ็นเซอร์วัดแรงดันอากาศในตัว ซึ่งจะช่วยรวบรวมข้อมูลในสภาพพื้นที่การใช้งานรวมทั้งการเคลื่อนตำแหน่งของผู้ใช้นำเอาไปวิเคราะห์ข้อมูลเพื่อปรับปรุงการทำงานของปัญญาประดิษฐ์ด้วย
ชุดอุปกรณ์ทั้งหมดทำงานโดยใช้ไฟจากแบตเตอรี่ขนาด 8300 mAh ตัวแบตเตอรี่นั้นถูกออกแบบให้มีกล่องห่อหุ้มเชื่อมต่อกับอุปกรณ์ด้วยสายไฟ ทำให้ในระหว่างการใช้งานผู้ใช้สามารถแยกเอาส่วนแบตเตอรี่มาคล้องกับเข็มขัดหรือใส่ในกระเป๋าเสื้อหรือกระเป๋ากางเกงได้ ช่วยลดน้ำหนักให้เหลือเพียงอุปกรณ์หลักจริงๆ เท่านั้นที่จะต้องห้อยคอ
เครื่อง GUIDE-Walk 2.0
ตัวปัญญาประดิษฐ์ Gabrielle ซึ่งเป็นหัวใจหลักในระบบการทำงานของ GUIDE-Walk นั้นสามารถจำแนกวัตถุต่างๆ ในภาพได้ 10 ประเภท คือ คนเดินถนน, รถยนต์, จักรยาน, จักรยานยนต์, รถบัส, เก้าอี้, ม้านั่ง, ถังขยะ รวมถึงไฟจราจรทั้งไฟเขียวและไฟแดง
อุปกรณ์ GUIDE-Walk นี้ยังคงอยู่ในขั้นการพัฒนาชิ้นงานต้นแบบ ในการทดสอบใช้งานผู้ร่วมทดสอบเห็นว่าระบบยังทำงานช้าอยู่บ้าง เช่นบางครั้งเขาได้ยินเสียงเครื่องยนต์ของรถยนต์แล่นผ่านมาก่อนจะได้ยินเสียงแจ้งเตือนจาก GUIDE-Walk แต่ก็คิดว่ามันมีประโยชน์ในฐานะเป็นอุปกรณ์เสริมเพื่อใช้งานในขณะออกเดินไปไหนมาไหน เนื่องด้วยรูปแบบการสื่อสารโดยเน้นการใช้เสียงแจ้งเตือน ทั้งนี้ Nemes ตั้งเป้าจะปรับปรุง GUIDE-Walk ให้มีขนาดเล็กลงและไอเดียในขณะนี้คือการปรับเปลี่ยนอุปกรณ์ให้อยู่ในรูปแบบของแว่นตาที่มีแผงวงจรในการประมวลภาพ
ที่มา - DW
Comments
เอ้อ เข้าท่าดีแฮะ เทคโนโลยีพร้อมแล้ว ถึงจะแทนไม้กับสุนัขนำทางไม่ได้ 100% แต่ก็คงช่วยได้มากเลย ยิ่งสื่อสารภาผาาคนได้ด้วย
บล็อกส่วนตัวที่อัพเดตตามอารมณ์และความขยัน :P
1.อบรมลูบหน้าปะจมูกไปวันๆครับ อบรมเสร็จได้ชั่วโมงยื่นขอเลื่อนขั้น
เอามาเดินฟุตบาทในไทย "สุนัข จักรยาน รถข็นขายของ หลุม ฝาท่อ มอเตอร์ไซค์ รถเข็น รถเข็น มอเตอร์ไซค์ มอเตอร์ไซค์ หลุม หลุม หลุม รถเข็น สุขัข" แบบรัวๆภายใน 5 วินาที
ต้นไม้กับป้ายโฆษณาด้วยครับ
แบตจะหมดเร็วเพราะพูดไม่หยุดด้วยนี่เอง 5555
เก่งแท้
..: เรื่อยไป
คล้ายๆ กับซีรีส์เกาหลี
มาเดินที่ไทยสงสัยโอเวอร์ฮีท อุปสรรคเยอะจัด
คือมันจะเป็นไปได้มั้ยที่จะใช้เป็นระบบเสียงแบบ Virtual surround ในการระบุตำแหน่งของวัตถุแทนที่จะเป็นคำพูด สร้างเสียงสังเคราะห์ออกมาแทนทำให้เรารู้ตำแหน่งวัตถุคร่าว ๆ และระยะใกล้ไกล
คิดว่าได้ครับ
แต่มันต้องพัฒนาหูฟังให้สร้างคลื่นเสียงได้หลายๆ ทิศ แบบโรงหนังด้วย
ส่วน software นี้ก็ต้องใช้ความรู้ Physic/Computer science แบบ 60/40 (Physic มากหน่อย)
เรื่องทิศทางเสียงสมัยนี้ทำได้รอบทิศทางแล้วครับถึงแม้หูฟังแค่แยกซ้ายขวา
ลองหาดูใน youtube ได้ครับ เสียงจริงๆมาแค่ซ้ายขวา แต่ทำให้ความรู้สึกเหมือนมารอบทิศทางได้ (แต่เสียงจากด้านหลังอาจจะไม่ค่อยเนียนเท่าไร) ทำได้ทั้งทาง software และ hardware ครับ
อย่างหูฟังไร้สายหลายรุ่นก็ support อยู่แล้ว
จริงๆเทคโนโลยีปัจจุบันมันทำได้แล้วครับ (ลอง Keyword ว่า HRTF ดูครับ) เพียงแต่แต่สูตรในการคำนวณเพื่อจำลองทิศทางของเสียงนั้น มันค่อนข้างเจาะจงกับสรีระร่างกายแต่ละคนด้วย โดยเฉพาะหัวและหู
เพราะงั้นถ้าจะให้จำลองเสียงได้แม่นยำจริงๆก็ต้องให้มันสามารถปรับแต่ง parameter ต่างๆตามร่างกายเราได้ด้วยครับ
ปัจจุบันก็มีหลายยี่ห้อที่ทำอยู่ เช่น Audeze Mobius ก็สามารถระบุขนาดเส้นรอบวงหัวและระยะห่างระหว่างหูแล้วไปตั้งค่าในโปรแกรมได้ หรือ Airpod Pro 2 ล่าสุดก็ใช้กล้อง TrueDepth สร้าง Profile จากรูปทรงของศรีษะเราให้เลย เป็นต้นครับ
อาจจะเวิ้กครับ แต่ต้องระวังไม่ให้รบกวนเสียงสิ่งแวดล้อมจริงด้วยครับ
ถ้าเป็น Airpods pro 2 + ambient mode? รองรับ Spatial audio อยู่แล้วด้วย
ไม่แน่ใจว่าใช่คน German หรือเปล่า
เพราะเท่าที่รู้ภาษา German ไม่ใช้ á มีแต่ ä
อ่านทีแรกเป็น เด็ก 18 ทำกล้องห้อยคอพัง