Tags:
Node Thumbnail

Google DeepMind เปิดซอร์สโค้ด SynthID Text ตัวช่วยสร้างลายน้ำเพื่อบอกว่าข้อความสร้างด้วย AI เพื่อนำไปใช้ตรวจสอบได้ในอนาคต

Google DeepMind มี SynthID สำหรับทำลายน้ำลงในภาพ AI อยู่ก่อนแล้ว กรณีของภาพ ทุกคนคงนึกออกว่าการแทรกลายน้ำที่แยกด้วยสายตามนุษย์ไม่เห็นคงทำได้ไม่ยากนัก เพราะในหนึ่งภาพมีปริมาณข้อมูลอยู่มาก การแทรกลายน้ำเพิ่มไปอีกหน่อยคงไม่ใช่เรื่องยาก แต่เมื่อต้องใส่ลายน้ำลงในข้อความ text ล้วนๆ จะทำอย่างไร

SynthID Text ใช้หลักการว่า โมเดลภาษา LLM คือ "เครื่องพ่นคำ" คาดเดาคำถัดไปจากความน่าจะเป็น โดยคำหรือ token ที่มีค่าความน่าจะเป็นสูงสุดจะถูกคัดเลือกออกมาเป็นผลลัพธ์ให้ผู้ใช้เห็น

สิ่งที่ SynthID Text ทำคือเข้าไปเปลี่ยนค่า "ความน่าจะเป็น" ในขั้นตอนสุดท้ายก่อนโมเดล LLM พ่นคำออกมา (ไม่จำเป็นต้องไปยุ่งกับตัวโมเดล ไม่ต้องเทรนใหม่) ซึ่งจะได้ผลลัพธ์ที่แตกต่างออกไปบ้าง แต่ SynthID จะพยายามรักษาคุณภาพของผลลัพธ์ให้ใกล้เคียงกับต้นฉบับจาก LLM เอาไว้

No Description

No Description

ผลลัพธ์ที่ผ่าน SynthID จะมีบางคำในข้อความที่ถูกปรับน้ำหนักความน่าจะเป็นโดย SynthID โดยน้ำหนักเหล่านี้สามารถปรับค่าได้จากตัวซอฟต์แวร์ SynthID โดยตรง ทำให้ผู้สร้างโมเดล LLM ที่ปรับน้ำหนักแล้วทราบว่าตัวเองปรับน้ำหนักคำไว้อย่างไร และสามารถตั้งคอนฟิกให้ตัวตรวจจับข้อความ AI รู้จักแพทเทิร์นของน้ำหนักที่ตั้งค่าไว้ได้ จึงพยากรณ์ได้แม่นยำว่าข้อความนี้สร้างด้วย AI หรือไม่

DeepMind บอกว่าเทคนิค SynthID Text ใช้ได้กับข้อความที่สั้นเพียง 3 ประโยคขึ้นไป และถ้าข้อความยิ่งยาวเท่าไร การตรวจจับก็ยิ่งมีความแม่นยำสูงขึ้นด้วย แต่ถ้าข้อความถูกนำไปดัดแปลงต่อในภายหลัง (เช่น มนุษย์ไปปรับแก้) โอกาสตรวจจับได้ย่อมลดลง

No Description

เทคนิค SynthID ถูกนำมาใช้งานแล้วกับข้อความที่สร้างโดย Gemini แล้ว และทางทีมวิจัยของ Google DeepMind ได้ลองนำข้อความจาก Gemini เกือบ 20 ล้านข้อความ ทั้งที่ใส่ลายน้ำและไม่ใส่มาตรวจสอบคุณภาพของผลลัพธ์ จากการให้ thumb up/down โดยผู้ใช้งาน พบว่าแทบไม่แตกต่าง (คะแนนห่างกัน 0.01%-0.02%)

ไลบรารี SynthID Text เปิดเป็นโอเพนซอร์สแล้วบน GitHub ใช้ไลเซนส์เปิดกว้าง Apache 2.0 และตอนนี้มี Hugging Face นำไปใช้งานแล้วในโมเดลตระกูล Transformers บนแพลตฟอร์มของตัวเอง

ที่มา - Google, Google AI, SynthID

Get latest news from Blognone

Comments

By: zyzzyva
Blackberry
on 24 October 2024 - 17:13 #1325601

ลง Front Page Nature ไม่รู้ฉบับที่เท่าไหร่แล้ว

By: chieffy on 25 October 2024 - 01:00 #1325616

กันการแก้ด้วยคนไม่ได้ กันการแก้ด้วย AI อื่นไม่ได้
ในฐานนะคนเคยทำการหลบหลีก google มาได้ไกลและ แต่ยังไม่สุด