Kaggle แพลตฟอร์มชุมชน data science ซึ่งมีกูเกิลเป็นเจ้าของ ประกาศความร่วมมือกับ Wikimedia Foundation ผู้ดูแลโครงการ Wikipedia นำชุดข้อมูล (dataset) แบบ structured ที่ปรับแต่งให้เหมาะกับการฝึกฝน AI เผยแพร่ผ่านชุมชน Kaggle
ชุดข้อมูลที่นำมาเผยแพร่นี้มีมากกว่า 461,000 ชุดข้อมูล ในภาษาอังกฤษและภาษาฝรั่งเศส นำมาจากบน Wikipedia การนำข้อมูลมาจัดใหม่นี้ทำให้นักวิทยาศาสตร์ข้อมูล นักวิจัย หรือบุคคลที่สนใจ สามารถนำไปศึกษาใช้งานได้ต่ออย่างสะดวกมากยิ่งขึ้น
Wikimedia Foundation หน่วยงานที่ดูแล Wikipedia ออกรายงานผลกระทบจากบอท AI ที่เข้ามาดูดเนื้อหาของโครงการ จนกระทบกับทรัพยากรระบบที่เตรียมไว้รองรับผู้ใช้งานทั่วไปที่เป็นมนุษย์
การเข้ามาของบอท AI นั้นเพิ่มมากขึ้นนับตั้งแต่ต้นปี 2024 โดย Wikimedia บอกว่าส่วนที่กระทบมากคือเนื้อหาสื่อผสมผสานทั้งรูปภาพ วิดีโอ และไฟล์ต่าง ๆ โดยพบทราฟิกส่วนนี้เพิ่มขึ้น 50% จากจำนวนไฟล์ที่มีมากกว่า 144 ล้านไฟล์