กูเกิลเปิดฐานข้อมูล Open Images เป็นข้อมูล URL ภาพกว่า 9 ล้านภาพจากแหล่งต่างๆ เช่น Flickr และข้อมูลบรรยายภาพเหล่านั้น สำหรับใช้ฝึกระบบปัญญาประดิษฐ์
ความยากของการฝึกระบบปัญญาประดิษฐ์ขึ้นใหม่ คือการหาข้อมูลที่บรรยายว่าบนภาพนั้นมีอะไรบ้าง เช่น รถยนต์, คนเดินถนน, ทางเท้า ฯลฯ ปกติแล้วงานวิจัยที่ต้องการพัฒนาระบบปัญญาประดิษฐ์จะต้องใช้ฐานข้อมูลที่มีอยู่จำกัด หรือไม่ก็สร้างฐานข้อมูลขึ้นเองซึ่งมีต้นทุนสูง
ฐานข้อมูล Open Images เป็นไฟล์ CSV ที่ต้องไปดาวน์โหลดรูปมาเอง ตัวฐานข้อมูลมีทั้งแบบบรรยายด้วยมนุษย์ขนาด 9MB รวม 167057 ภาพ และแบบบรรยายด้วยซอฟต์แวร์ขนาดถึง 450MB รวม 9011219 ภาพ
กระบวนการดาวน์โหลดคงต้องเขียนโปรแกรมดาวน์โหลดเอาเอง ใครอยากลองใช้อย่าลืมเตรียมพื้นที่ดิสก์ให้เพียงพอ
ที่มา - Google Research
Comments
google ไปเอารูปจาก flicrk ที่เป็นของ yahoo #แบบนี้ก็ได้เหรอ
WE ARE THE 99%
ภาพทั้งหมดเป็นของผู้ใช้นี่ครับ เขาระบุถึงเรื่องนี้ด้วยว่าภาพที่ใช้เป็น creative commons และเตือนให้ผู้นำฐานข้อมูลไปใช้ว่าภาพอาจจะถูกปรับลิขสิทธิ์เป็นแบบอื่นแล้ว
เรื่องการดาวน์โหลดขึ้นกับแต่ละเว็บว่ามี term of use ในการดาวน์โหลดอย่างไร
คุยในเรื่องลิขสิทธิ์ ผมมองว่าต่อให้ภาพไม่ใช่ creative commons ถ้าไม่ได้ส่งต่อตัวภาพ บอกว่าภาพในเว็บนั้นคือภาพรถ ภาพในเว็บนี้คือภาพจาน แบบนั้นก็ไม่ได้ผิดอะไรอยู่ดีครับ
lewcpe.com, @wasonliw