ปัญหาอย่างหนึ่งในวงการ AI คือการหาชุดข้อมูล (dataset) ขนาดใหญ่พอเพื่อใช้เทรน AI ให้สามารถเรียนรู้จากชุดข้อมูลตัวอย่างได้ ในวงการประมวลผลภาพ มีโครงการ ImageNet คอยทำหน้าที่นี้ให้ แต่พอเป็นการประมวลผลวิดีโอกลับไม่มีชุดข้อมูลในลักษณะเดียวกัน
Google Research จึงเปิดโครงการ YouTube-8M ที่มีฐานข้อมูลวิดีโอ YouTube ถึง 8 ล้าน URL, มีความยาววิดีโอรวมกัน 5 แสนชั่วโมง และมาพร้อมกับป้ายคำ label ของวิดีโอที่ครบถ้วนและหลากหลาย เพื่อให้ระบบ AI สามารถประมวลผลวิดีโอแล้วทดสอบการแยกแยะวิดีโอ เทียบกับป้ายคำที่มีอยู่แล้วได้ ในชุดข้อมูลของกูเกิลยังแคปหน้าจอทุก 1 วินาทีด้วยเทคนิค machine learning เพื่อให้ง่ายต่อการนำไปประมวลผลต่อ และช่วยให้ไฟล์รวมมีขนาดเล็กลง (จากวิดีโอทั้งหมดมีขนาดระดับ petabyte ลงมาเหลือ 1.5 TB)
กูเกิลเลือกวิดีโอที่มีสถานะเป็น public และมีคนดูมากกว่า 1,000 ครั้ง นอกจากนี้ยังเน้นความหลากหลายของวิดีโอ เพื่อให้กระจายครอบคลุมหัวข้อต่างๆ ผู้ที่นำไปใช้ต่อในงานเฉพาะด้าน (เช่น ประมวลผลวิดีโอกีฬาเพียงอย่างเดียว) จะได้มีขนาดข้อมูลที่ใหญ่มากพอ
ที่มา - Google Research Blog
Comments
อยากได้ image processing algolithm ใหม่ๆละสิ ถึงได้แจกทองคำขนาดนี้ แต่ทำถูกต้องแล้วละครับ สุดยอดจริงๆ Google
ใจดีจุง
เจอ PPAP เข้าไปคงงงเลย
5 5 5 มีแต่ปากกา แอปเปิล สับปะรด เอาไปไว้ในหมวดผลไม้เลยคลิปนี้
หลงเข้ามาแชนแนลผมหละก็ อย่าลืมคลิ๊กแอดให้ด้วยน้าาาา
ขออภัยครับ ซ้ำเฉยเลย แค่ขอให้ AI กดแอดเอง หะหะหะ