MIT ถอนชุดข้อมูล Tiny Images ออกจากเว็บหลังจากมีรายงานว่าภาพหลายพันภาพถูกบรรยายด้วยคำหยาบและดูถูก เช่น โสเภณี, พวกล่อลวงเด็ก (child molester), ไอ้มืด (nigger) รวมถึงมีภาพไม่เหมาะสม จนทำให้ให้วิจัย Computer Science and Artificial Intelligence Lab (CSAIL) ตัดสินใจถอดชุดข้อมูลออกจากเว็บ และขอให้นักวิจัยกลุ่มอื่นเลิกใช้ชุดข้อมูลนี้และลบออกจากเว็บเช่นกัน
Tiny Images เป็นชุดข้อมูลภาพ 80 ล้านภาพที่มีขนาดเพียง 32x32 พิกเซล โดยเป็นภาพที่ดาวน์โหลดจากอินเทอร์เน็ตแล้วย่อลงมา โดยชุดข้อมูลสร้างจากการใช้คำค้นใน WordNet นำคำในรายการไปค้นจาก search engine หาภาพแล้วนำมาจับคู่กับคำค้น
ศาสตราจารย์ Antonio Torralba จาก CSAIL ระบุว่าทีมวิจัยควรตรวจสอบภาพด้วยมือก่อนใส่ในชุดข้อมูล แต่ภาพที่ย่อไปแล้วนี้มีขนาดเล็กจนตรวจสอบได้ยาก (ทีมวิจัยไม่ได้เก็บภาพขนาดเต็มไว้) จึงตัดสินใจถอดชุดข้อมูลออกไปทั้งชุด
ที่มา - The Register
Comments
เห็นสาเหตุแล้วไม่ค่อยแปลกใจเท่าไหร่
บล็อกส่วนตัวที่อัพเดตตามอารมณ์และความขยัน :P
สวัสดี simsimi
:-)