Wikipedia นั้นเป็นแหล่งสารานุกรมออนไลน์ที่มักจะมีลิงก์อ้างอิงไปที่เว็บไซต์อื่น ๆ เสมอ แต่บ่อยครั้งที่เว็บไซต์ที่ Wikipedia อ้างถึงนั้นไม่มีตัวตนแล้วหรือลิงก์เสีย ซึ่ง Internet Archive ที่มีระบบเก็บข้อมูลเว็บไซต์ Wayback Machine ก็ได้เข้ามาช่วยแก้ปัญหานี้
Internet Archive ได้ร่วมกับชุมชน Wikipedia ทำบอทที่ชื่อว่า IABot รันบนเว็บไซต์ Wikipedia เพื่อค้นหาลิงก์เสีย ซึ่งเมื่อบอทเจอลิงก์เสียแล้วก็จะไปค้นใน Wayback Machine รวมถึง web archive อื่น ๆ และนำลิงก์ใหม่แปะลิงก์เข้าไปแทนลิงก์ที่เสียเหล่านั้น เพื่อทำให้ Wikipedia มีข้อมูลที่แม่นยำและตรวจสอบได้
ทาง Internet Archive บอกว่าได้รันบอทนี้มาแล้ว 3 ปีบนเว็บไซต์ Wikipedia ทั้งหมด 22 ภาษา ซึ่งจนถึงทุกวันนี้บอททั้งหมดสามารถแก้ไขลิงก์ได้แล้วกว่า 6 ล้านลิงก์ รวมถึงชุมชน Wikipedia ก็ช่วยกันแก้ลิงก์ไปแล้วกว่า 3 ล้านลิงก์ รวมเป็น 9 ล้านลิงก์ที่ตอนนี้ชี้ไปยัง Wayback Machine หรือบริการ web archive อื่น ๆ
การซ่อมลิงก์ของ Internet Archive และชุมชน Wikipedia นั้นถือว่าได้ผลที่น่าพอใจมาก โดยจะเห็นได้ว่าจากผลสำรวจการคลิกลิงก์บน Wikipedia ของ Wikimedia Foundation พบว่าลิงก์ที่ไปยัง Wayback Machine มียอดสูงที่สุด และสูงกว่าเว็บไซต์อันดับสองคือ books.google.com ถึง 3 เท่า และถ้าคิดเฉพาะลิงก์บน Wikipedia เวอร์ชันภาษาอังกฤษที่ชี้ไปยัง Wayback Machine จะมีการคลิกอยู่ที่ราว 25,000 ครั้งต่อวัน
ที่มา - Internet Archive
ภาพ Nirzar Pangarkar/Wikimedia Foundation, CC BY-SA 3.0
Comments
เยี่ยม
มันจะมีหนังสือพิมพ์บางฉบับที่ ถ้าเป็นข่าวใหม่จะให้อ่านได้ แล้วมีคนเอาไปทำเป็น link ใน wikipedia
พอผ่านไปซักพัก ทาง website ของหนังสือพิมพ์จะไม่ให้อ่าน
ผู้ที่อ่านได้จะต้องสมัครสมาชิกเท่านั้นซึ่งเสียค่าใช้จ่าย ถึงจะอ่านข่าวเก่าๆย้อนหลังได้
ถ้าเป็นแบบนี้ทาง wikipedia จะทำการ archive หรือเปล่า ?