Wikimedia Foundation องค์กรผู้ดูแลเว็บไซต์สารานุกรมเสรี Wikipedia ได้ระบุถึงการนำ machine learning มาใช้เพื่อประโยชน์ในการทำระบบการอ้างอิงของ Wikipedia
Wikimedia ระบุว่า กลไกสำคัญที่ทำให้ Wikipedia รักษาคุณภาพระดับสูงเอาไว้ได้นั่นก็คือ inline citation หรือการอ้างอิงในเนื้อหา ซึ่งการอ้างอิงเหล่านี้จะทำให้ผู้อ้างและผู้แก้ไขมั่นใจว่าข้อความในบทความนั้น ๆ สะท้อนแหล่งข้อความอย่างเที่ยงตรง ส่วนเนื้อหาอะไรที่ไม่มีแหล่งข้อมูลชัดเจน จะต้องถูกลบหรือมีการแปะว่า “ต้องการอ้างอิง”
อย่างไรก็ดี การตัดสินใจว่าประโยคไหนต้องการอ้างอิงหรือไม่นั้นไม่ใช่งานง่าย ผู้แก้ไขก็ต้องหลีกเลี่ยงการใส่ข้อความอ้างอิงที่เป็นความรู้พื้นฐานหรือเป็นที่รู้จักกันโดยทั่วไป อย่างเช่นท้องฟ้าเป็นสีฟ้า และขนาดใหญ่ระดับ Wikipedia ก็ยิ่งไม่ใช่เรื่องง่าย
ไม่นานมานี้ Wikimedia เพิ่งจะดีไซน์เค้าโครงเพื่อช่วยให้ผู้แก้ไขระบุและจัดลำดับความสำคัญว่า ประโยคไหนต้องการการอ้างอิงใน Wikipedia บ้าง และหลังจากได้ศึกษากับผู้แก้ไขบทความในภาษาอังกฤษ, อิตาลี และฝรั่งเศส ก็ได้กลั่นกรองออกมาเป็นเหตุผลโดยทั่วไปว่าทำไมประโยคแต่ละประโยคใน Wikipedia จึงต้องการการอ้างอิง
เมื่อได้ข้อมูลมาเพียงพอแล้ว Wikimedia จึงเริ่มเทรนโมเดลด้วย machine learning และให้โมเดลทำนายว่าประโยคที่ให้นี้ต้องการอ้างอิงหรือไม่ และทำไม ตอนนี้จะมีเฉพาะ Wikipedia ภาษาอังกฤษ ส่วนภาษาอื่นจะดีพลอยระบบในอีก 3 เดือนข้างหน้า
Wikimedia ระบุว่า ระบบนี้สามารถช่วยอาสาสมัครของ Wikipedia ในการตรวจสอบและพิสูจน์ข้อเท็จจริง ซึ่งจะยังเป็นการเพิ่มความน่าเชื่อถือของ Wikipedia ในระยะยาวด้วย
สำหรับรายละเอียดที่น่าสนใจ สามารถอ่านเพิ่มเติมได้จาก Wikimedia Blog
ที่มา - Wikimedia, VentureBeat
ภาพโดย XKCD