Kaggle แพลตฟอร์มชุมชน data science ซึ่งมีกูเกิลเป็นเจ้าของ ประกาศความร่วมมือกับ Wikimedia Foundation ผู้ดูแลโครงการ Wikipedia นำชุดข้อมูล (dataset) แบบ structured ที่ปรับแต่งให้เหมาะกับการฝึกฝน AI เผยแพร่ผ่านชุมชน Kaggle
ชุดข้อมูลที่นำมาเผยแพร่นี้มีมากกว่า 461,000 ชุดข้อมูล ในภาษาอังกฤษและภาษาฝรั่งเศส นำมาจากบน Wikipedia การนำข้อมูลมาจัดใหม่นี้ทำให้นักวิทยาศาสตร์ข้อมูล นักวิจัย หรือบุคคลที่สนใจ สามารถนำไปศึกษาใช้งานได้ต่ออย่างสะดวกมากยิ่งขึ้น
ก่อนหน้านี้ Wikipedia เปิดเผยถึงความท้าทายในการดูแลทรัพยากรระบบ จากการถูกบอทดูดข้อมูลเพื่อฝึกฝน AI เข้ามาใช้งานมากขึ้น การเผยแพร่ชุดข้อมูลปรับแต่งผ่าน Kaggle นี้ จึงอาจเป็นแนวทางแก้ไขปัญหาหนึ่งเช่นกัน
ที่มา: Kaggle
Comments
ข่าวต่อไป: Wikipedia ถูกป่วน แก้ไขข้อมูลเป็นขยะจำนวนมาก
กราบขอบพระคุณอย่างสูง
ภาษาอื่น ๆ ยิงต่อไปเหมือนเดิม
บล็อก: wannaphong.com และ Python 3
ขอบคุณครับเพิ่มเติมข้อมูลแล้ว
แบบนี้ไปสร้าง local wiki ได้เลยรึเปล่านะ