Tags:
Node Thumbnail

Cloudflare เปิดตัว AI Labyrinth เครื่องมือสำหรับควบคุมและจัดการบอตดูดเนื้อหาเว็บไปเทรน AI (AI Crawler) โดยเน้นไปที่บอตซึ่งไม่ทำตามคำสั่งที่ระบุใน robots.txt ซึ่งกำลังเป็นปัญหาอยู่ตอนนี้

วิธีการของ AI Labyrinth ไม่ได้ใช้การบล็อกบอตดูดเนื้อหา เพราะหลายกรณีผู้พัฒนาก็หาวิธีหลบเลี่ยงได้ แนวทางใหม่คือการใช้ Generative AI โดยเมื่อพบพฤติกรรมที่น่าจะเป็นบอตดูดเนื้อหาเทรน AI ระบบจะเขียนเนื้อหาใหม่ขึ้นมา แล้วทำให้บอตติดวนอยู่ในเนื้อหาสร้างใหม่ที่ไม่มีอยู่จริง ซึ่งคนทั่วไปก็เข้าไปอ่านไม่ได้ ผลคือเจ้าของบอตก็ไม่ได้ข้อมูลที่ต้องการ แถมเสียเวลาและทรัพยากรในการรันนี้อีก

ฟีเจอร์ AI Labyrinth มีให้ใช้งานแล้วสำหรับลูกค้า Cloudflare ทุกคนรวมทั้งแผนใช้งานฟรี โดยต้องเปิดใช้งานเอง (opt-in)

ที่มา: Cloudflare

No Description

Get latest news from Blognone

Comments

By: specimen
Windows PhoneAndroid
on 22 March 2025 - 15:57 #1336530
specimen's picture

อันนี้โหดกว่า หลอกให้ดูดข้อมูลทิพย์
ดีไม่ดี ข้อมูลทิพย์ เอาไปเทรน แล้วทำให้คำตอบหลังเทรนพังอีก

By: mr_tawan
ContributoriPhoneAndroidWindows
on 22 March 2025 - 19:57 #1336550
mr_tawan's picture

สกายเน็ตก็คงเกิดจากสิ่งนี้


  • 9tawan.net บล็อกส่วนตัวฮับ
By: AMp
In Love
on 22 March 2025 - 21:54 #1336561

คิดค่า token มั้ยยยยย

By: Tasksenger on 23 March 2025 - 06:12 #1336572

เหมือนใส่ผงกัญชาลงในข้อมูล ดูดไปหลอนเลย 555

By: max212
AndroidRed HatSUSEUbuntu
on 23 March 2025 - 14:08 #1336590 Reply to:1336572
max212's picture

แล้ว AI มันจะเสพติดข้อมูลที่ทำให้หลอนไหมครับ แบบว่าว๊าว!!! ของใหม่ล้ำจินตนาการ

By: Tasksenger on 23 March 2025 - 17:14 #1336602 Reply to:1336590

ถ้าถามผมนะ วันนึงถ้าเราทำให้ AI มีความอารมณ์ความรู้สึก และตอบสนองต่อปัจจัยภายนอกที่ทำให้เกิดอารมณ์ได้ เมื่อต้องมีการซ่อมบำรุงระบบ ในระหว่างนั้นอาจต้องทำให้มันหลอนชั่วคราวเพื่อไม่ให้เกิดการต่อต้าน เพราะโดยธรรมชาติของสมองมนุษย์ (ถ้าอิงการพัฒนาจากพฤติกรรมของมนุษย์) เมื่อเกิดการต่อต้านมันจะมีแน้วโน้มบันทึกเป็นความจำระยะยาว หรือง่ายๆ ก็คือความเคียดแค้นนั่นแหล่ะ ดังนั้นในระหว่างแก้ไขระบบ โดยไม่ปิดระบบลงไปทั้งหมด ก็คงต้องทำให้หลอนไปชั่วขณะ หรือคำที่ผมมักใช้บ่อยๆ ก็คือทำให้ AI ฝันได้เพื่อเรียบเรียงข้อมูลใหม่ตามสิ่งที่เข้ามาในช่วงวัน หรือจำลองสถานะการณ์จากข้อมูลใหม่ที่ได้รับ เพื่อรองรับการทำงานในวันถัดไปนั่นแหล่ะ ซึ่งผมว่ามันอาจเป็น Keyword สำคัญในการพัฒนา AI ที่ใกล้เคียงมนุษย์ได้ และมีความสามารถในการจินตนาการได้

By: Rapier
AndroidWindows
on 23 March 2025 - 16:43 #1336601
Rapier's picture

อันนี้มันจะลามมาจนเป็นผลเสียกับผู้ใช้งาน AI ไหมนี่
หลอนไปอีก

By: tontan
ContributorAndroidSymbianUbuntu
on 23 March 2025 - 17:44 #1336605 Reply to:1336601
tontan's picture

ถ้าทำตาม robots.txt ก็ไม่เป็นไรแล้วครับ โดยเฉพาะถ้าเว็บไซต์กำหนด robots.txt

User-agent: *
Disallow: /

ไม่ควรดึง ไม่ใช่ไปพยายามดึงอีก


บล็อก: wannaphong.com และ Python 3