Cloudflare เปิดตัว AI Labyrinth เครื่องมือสำหรับควบคุมและจัดการบอตดูดเนื้อหาเว็บไปเทรน AI (AI Crawler) โดยเน้นไปที่บอตซึ่งไม่ทำตามคำสั่งที่ระบุใน robots.txt ซึ่งกำลังเป็นปัญหาอยู่ตอนนี้
วิธีการของ AI Labyrinth ไม่ได้ใช้การบล็อกบอตดูดเนื้อหา เพราะหลายกรณีผู้พัฒนาก็หาวิธีหลบเลี่ยงได้ แนวทางใหม่คือการใช้ Generative AI โดยเมื่อพบพฤติกรรมที่น่าจะเป็นบอตดูดเนื้อหาเทรน AI ระบบจะเขียนเนื้อหาใหม่ขึ้นมา แล้วทำให้บอตติดวนอยู่ในเนื้อหาสร้างใหม่ที่ไม่มีอยู่จริง ซึ่งคนทั่วไปก็เข้าไปอ่านไม่ได้ ผลคือเจ้าของบอตก็ไม่ได้ข้อมูลที่ต้องการ แถมเสียเวลาและทรัพยากรในการรันนี้อีก
ฟีเจอร์ AI Labyrinth มีให้ใช้งานแล้วสำหรับลูกค้า Cloudflare ทุกคนรวมทั้งแผนใช้งานฟรี โดยต้องเปิดใช้งานเอง (opt-in)
ที่มา: Cloudflare
Comments
อันนี้โหดกว่า หลอกให้ดูดข้อมูลทิพย์
ดีไม่ดี ข้อมูลทิพย์ เอาไปเทรน แล้วทำให้คำตอบหลังเทรนพังอีก
สกายเน็ตก็คงเกิดจากสิ่งนี้
คิดค่า token มั้ยยยยย
เหมือนใส่ผงกัญชาลงในข้อมูล ดูดไปหลอนเลย 555
แล้ว AI มันจะเสพติดข้อมูลที่ทำให้หลอนไหมครับ แบบว่าว๊าว!!! ของใหม่ล้ำจินตนาการ
ถ้าถามผมนะ วันนึงถ้าเราทำให้ AI มีความอารมณ์ความรู้สึก และตอบสนองต่อปัจจัยภายนอกที่ทำให้เกิดอารมณ์ได้ เมื่อต้องมีการซ่อมบำรุงระบบ ในระหว่างนั้นอาจต้องทำให้มันหลอนชั่วคราวเพื่อไม่ให้เกิดการต่อต้าน เพราะโดยธรรมชาติของสมองมนุษย์ (ถ้าอิงการพัฒนาจากพฤติกรรมของมนุษย์) เมื่อเกิดการต่อต้านมันจะมีแน้วโน้มบันทึกเป็นความจำระยะยาว หรือง่ายๆ ก็คือความเคียดแค้นนั่นแหล่ะ ดังนั้นในระหว่างแก้ไขระบบ โดยไม่ปิดระบบลงไปทั้งหมด ก็คงต้องทำให้หลอนไปชั่วขณะ หรือคำที่ผมมักใช้บ่อยๆ ก็คือทำให้ AI ฝันได้เพื่อเรียบเรียงข้อมูลใหม่ตามสิ่งที่เข้ามาในช่วงวัน หรือจำลองสถานะการณ์จากข้อมูลใหม่ที่ได้รับ เพื่อรองรับการทำงานในวันถัดไปนั่นแหล่ะ ซึ่งผมว่ามันอาจเป็น Keyword สำคัญในการพัฒนา AI ที่ใกล้เคียงมนุษย์ได้ และมีความสามารถในการจินตนาการได้
อันนี้มันจะลามมาจนเป็นผลเสียกับผู้ใช้งาน AI ไหมนี่
หลอนไปอีก
ถ้าทำตาม robots.txt ก็ไม่เป็นไรแล้วครับ โดยเฉพาะถ้าเว็บไซต์กำหนด robots.txt
ไม่ควรดึง ไม่ใช่ไปพยายามดึงอีก
บล็อก: wannaphong.com และ Python 3