หลายคนแถวนี้คงคุ้นเคยกับ reCAPTCHA บริการตรวจสอบความเป็นมนุษย์ผ่านการอ่านตัวอักษรบิดๆ เบี้ยวๆ ที่กูเกิลซื้อไปเมื่อหลายปีก่อน และคง "รู้ซึ้ง" ถึงความยากของมันเป็นอย่างดี
ล่าสุดทีม reCAPTCHA ออกมาให้ข้อมูลว่าเทคโนโลยีด้าน AI ทำให้บ็อตเก่งขึ้นเรื่อยๆ จน reCAPTCHA ต้องสร้างรหัสที่ยากขึ้นเรื่อยๆ จนเป็นปัญหาว่ามนุษย์เองก็เริ่มอ่านไม่ออก ทางทีมจึงต้องวิจัยหาแนวทางแก้ไขปัญหาที่ดีขึ้นกว่าเดิม
ทางออกของทีม reCAPTCHA คือการตรวจสอบตัวตนสองชั้น โดยชั้นแรกจะใช้เทคนิคด้านการประเมินความเสี่ยง (risk analysis) พิจารณาว่าผู้ใช้รายนั้นเป็นคนหรือเป็นบ็อต ถ้าคาดว่าผู้ใช้เป็นคน ก็จะส่งรหัสที่ไม่ยากมากนัก (ตัวอักษรหรือตัวเลขไม่บิดเบี้ยวจนอ่านไม่ออก ดูภาพประกอบ) ให้ตอบ แต่ถ้าคาดว่าเป็นบ็อตก็จะได้โจทย์ที่ยากขึ้น ผลลัพธ์คือมนุษย์กรอกรหัสง่ายขึ้นและกรองบ็อตได้ดีขึ้นไปในคราวเดียว
ทาง reCAPTCHA ไม่ได้เปิดเผยรายละเอียดว่าแยกแยะคนกับบ็อตได้อย่างไร ต้องรอดูกันในระยะยาวว่าฝ่ายผู้ควบคุมบ็อตจะสามารถเจาะระบบใหม่ของ reCAPTCHA ได้หรือไม่ครับ
ที่มา - Google Online Security Blog
Comments
อยากรู้ว่าระหว่างช่องตัวเลขต้องเว้นวรรคหรือป่าว เหมือนผมเคยเจอบางอันมันไม่ต้องเว้นบางอันต้องเว้น หรือว่าเดี๋ยวนี้ใช้ได้ทั้งสองแบบ
น้ำตาจะไหล
ปล.เพราะเพ่ง reCAPTCHA เพราะมากเกินไป
บ็อต นี่ออกเสียง บ๊อด เหมือน ล็อค ใช่ไหมครับ
ผมว่า ออกเสียงเป็น สระ "เอาะ" นะครับ "บอ-เอาะ-ดอ" = บ็อด
ถ้าไม้ตรี เสียงมันจะแหลมๆเหมือน ม๊อด (modulator)
ยังไงก็ได้ อย่าอ่านเป็นบอดเวลาเล่นป็อคก็พอ
น้ำตาจะไหล มิน่าช่วงหลังๆมานี้ง่ายขึ้นเยอะ ทีเดียวผ่านตลอด
ปกติ บอทมันอ่านตัวเลขจากภาพอย่างไร เหรอครับ
อ่านได้หมดครับ ถ้าเจนมาแบบง่าย ๆ โดนแกะได้หมด
ด้วยเทคนิก OCR ครับ แจ่กระบวนการทำงานนั้นเป็นความลับส่วนมาก
กลับมาแก้ตามความเห็น #647600 ว่า Image processing ครับ
ของเดิมผมบอกว่า k-NN มันเป็นชื่อ algorithm ที่ไว้ใช้ทำอะไรซักอย่าง 555
k nearest neighbor เอาไว้ทำ machine learning หรือ AI ไงครับ
เพราะคนเขียนโปรแกรมให้มันอ่านตัวอักษรตรงๆไม่ได้(ไม่รู้วิธีแน่ชัดในการประมวลผลภาพ)
เลยต้อง train คอมด้วย data ไปเรื่อยๆแทน
ขอบคุณครับ ได้มีเรื่องไปอ่านต่อแล้ว
คงจะเป็นแบบเดียวกับ โปรแกรมแปล ภาษา จากภาพสินะครับ
image processing
มิน่าล่ะถึงกรอกได้ง๊ายง่าย
i want this
http://www.blognone.com/node/32666
น้ำตาจะไหล อ่านง่ายซักทีครับ
ของผมถ้าจะใช้ web content ภาษษไทย ก็ให้ตอบคำถามที่จำเป็นต้องรู้ เช่น
ประมาณนี้
ผมไม่รู้ครับ ;___;
ผมว่ามันไม่ค่อยโอเคนะครับ เพราะคนส่วนใหญ่ไม่ใช่นักกฎหมาย ที่ต้องจำมาตราที่เท่าใดหรือโดนปรับกี่บาท เพียงที่คนทั่วไปรู้ว่ามันผิดก็น่าจะพอแล้วครับ
ผมก็ไม่รู้ = =
ผมว่าถามคำถามทางคณิตศาสตร์เป็นตัวหนังสือ แลวให้ตอบเป็นตัวเลขง่ายกว่านะ
เช่น เก้าบวกหนึ่งเท่ากับเท่าไหร่ ให้ตอบเป็นตัวเลข "10"
เห็นเมนต์นี้แล้วได้ไอเดียเลยครับ ถามเป็นโจทย์ชัดๆ บอทอาจจะจับใจความได้ง่ายไป ผมว่าแปลงให้เป็นโจทย์ปัญหาแบบที่เรียนกันตอนประถมน่าจะดีกว่า ส่วนคำตอบก็ให้ตอบเฉพาะตัวเลข เช่น มีคนอยู่สิบคน ต้องแบ่งออกเป็นสองแถวเท่าๆ กัน แต่ละแถวจะมีคนกี่คนไรงี้ ^^
@ Virusfowl
I'm not a dev. not yet a user.
ดีแล้ว แบบเก่าๆ อ่านทีน้ำตาแทบไหล
ดีใจมาก
น้ำตาไหลพรั่งพรู
Whatever who win, we loss ครับ สำหรับ reCAPTCHA เนี่ย
ไม่จะปรับกี่ครั้งๆ คนพิมพ์ก็อยากจะเอาหัวฟาดกำแพงทุกครั้ง
พิมพ์สองสามคำนั้น เห่อ..
บางทีให้กรอกสแควรูทด้วย เงิบมากๆ
แสดงว่าส่วนที่ให้กรอกรูท ไม่ใช่ส่วนที่เอาไว้ยืนยันตัวบุคคลครับ
เป็นผลถ้าเห็นว่าสิ่งที่เอาให้อ่านด้านหนึ่งมันผิดมนุษย์เกินไป เช่น เป็นภาษาจีน หรือเป็นสมการคณิตศาสตร์ ผมก็ไปสนใจคำอีกฝั่งแทน เพราะดูออกว่าฝั่งนี้เป็น crowdsourcing
คุณ panurat2000 ก็สู้ๆ นะครับ :P
Blog | Twitter
reCapcha ทำอะไรไม่ได้หรอกครับ :p
ถ้ารู้ว่าเป็นคน ก็ให้ผ่านไปเลยไม่ได้เหรอ
บอทมันอาจจะเลียบแบบคนครับ ฉนั้นก็ต้องมีอยู่ดี ตามเนื้อข่าวน่าจะเป็นการพบการครึ่งทางมากกว่าครับ
อยากเห็นตัวอย่างว่าถ้าเป็นบ็อทจะออกมายังไง
จะตอบแต่ละที รีเฟรชหลายรอบมากครับ บางอันอ่านไม่มีทางออก
เปลี่ยนเป็นตัวเลขอะดีแล้วครับ เพราะผมว่ามันกรอกง่ายกว่าตัวอักษรมาก ขนาดแว่นขยายยังดูไม่ออกเลยครับว่าตัวไรอะ - -