หน่วยวิจัยของเฟซบุ๊กเปิดตัว Detectron ซอฟต์แวร์จับวัตถุในภาพ (object detection) ที่อิมพลีเมนต์งานวิจัยยอดนิยมเช่น Faster R-CNN, RPN หรืองานวิจัยใหม่ๆ อย่าง Mask R-CNN และ RetinaNet ที่เพิ่งตีพิมพ์ในปี 2017 ที่ผ่านมา
ตัวซอฟต์แวร์พัฒนาบน Caffe2 โดยมี operator เฉพาะของ Detectron เอง ทำให้ใครที่ติดตั้ง Caffe2 อยู่แล้วอาจะต้องอัพเดตใหม่เพื่อให้รองรับ operator ใหม่ๆ เหล่านี้ด้วย และต้องการเครื่องที่มีชิปกราฟิกเท่านั้นไม่สามารถรันบนซีพียูได้
ตัวสัญญาอนุญาตเป็น Apache License 2.0 และเฟซบุ๊กระบุว่าสถาปัตยกรรมน่าจะง่ายต่อการเพิ่มเติมโมเดลในอนาคต ถ้าใครสนใจส่งแพตช์ทางเฟซบุ๊กก็ยินดี
Comments
อาจฟังดูเหลวไหลนะครับ แต่ผมอยากรู้จริงๆ ว่ามันแยกลุงตู่ กับแผ่นรูปลุงตู่ตอนยืนคู่กันได้มั้ยครับ หรือมันจะมองว่าเป็น person ทั้งคู่
ถ้าตาม pretrained model จาก imagenet หรือ coco จะออกมาเป็น person ทั้งคู่ครับ
ขอบคุณครับ ถ้าสมมติว่ามี infrared map มันจะช่วยให้แยกแยะคนจริงกับรูปถ่ายได้ดีขึ้นมั้ยครับ
ดีขึ้นครับ แต่ต้องเทรนโมเดลใหม่จากข้อมูลใหม่ และต้องปรับปรุง network ที่ใช้ train กับ predict อะ
มันไม่ง่ายเลยที่จะทำ GIF ให้มีขนาดน้อยกว่า 20kB
ข้อสำคัญคือ infrared 3D ต้องแม่นด้วยนะครับใช้ Intel Read Sense ตัว R300 คนข้างจะแย่อยู่ครับ แต่รอซื้อรุ่น D435 มาน่าจะดีขึ้นเยอะ
ขอบคุณทั้งสองท่านครับ