โมเดลธุรกิจหลักของโซเชียลมีเดียอย่างเฟซบุ๊กคือโฆษณา ที่ผ่านมาบริษัทก็พยายามทำให้โฆษณามีความเกี่ยวข้อง (relevant / personalized) กับความสนใจของผู้ใช้งานแต่ละคนมากที่สุด
หลายครั้งโฆษณาของเฟซบุ๊กมีความเกี่ยวข้องกับเรามากเกินไปจนน่ากลัว เช่น โฆษณาปรากฎขึ้นมาหลังการสนทนากับเพื่อนไม่นาน เลยกลายมาเป็นประเด็น (บางทีก็กลายเป็นข้อสรุปเลย) ว่าเฟซบุ๊กต้องแอบดักฟังเสียงเราแน่ ๆ ถึงสามารถแสดงโฆษณาได้แม่นยำและถูกต้องขนาดนั้น
โดยส่วนตัวผู้เขียนเชื่อว่าเฟซบุ๊กไม่ได้ดักฟังเราจริง ๆ โดยบทความนี้จะพยายามอธิบายว่าทำไมผมถึงเชื่อเช่นนั้น แล้วเมื่อเฟซบุ๊กไม่ได้ดักฟังแล้ว มันแสดงโฆษณาขึ้นมาได้ตรงเผงตามที่เราพูดคุยกันได้ยังไง
Antonio García Martínez อดีต Product Manager ที่เคยดูแลผลิตภัณฑ์ด้านโฆษณาของเฟซบุ๊กอย่าง Facebook Pixel เครื่องมือติดตามการใช้งานผู้ใช้บนเว็บไซต์ (จะกล่าวถึงอย่างละเอียดต่อไปในบทความ) เคยเขียนบทความคิดเห็นพิเศษ (op-ed) ลงบนนิตยสาร WIRED โต้แย้งว่าเฟซบุ๊กไม่น่าจะดักฟังผู้ใช้งานด้วยเหตุผลเชิงเทคนิค 2 ข้อ
ข้อแรกคือการดักฟังผู้ใช้ เท่ากับว่าสมาร์ทโฟนจะต้องสื่อสารกับเซิร์ฟเวอร์เฟซบุ๊กตลอดเวลาแบบ VoIP ปริมาณดาต้าประมาณ 3 กิโลไบต์ต่อวินาที สมมติว่าใช้โทรศัพท์แค่ครึ่งวัน (ซึ่งก็ไม่น่าจะเป็นไปได้) เท่ากับว่าเฟซบุ๊กต้องใช้ทราฟิคราว 130MB ต่อคนต่อวัน เฉพาะในอเมริกามีผู้ใช้เป็นประจำทุกวันราว 150 ล้านคน ปริมาณทราฟิคเฉพาะสหรัฐก็ปาเข้าไป 20 เพตาไบต์ต่อวันเข้าไปแล้ว ขณะที่ปัจจุบันปริมาณดาต้าของเฟซบุ๊กที่ใช้อยู่อยู่ที่ราว 600 เทราไบต์เท่านั้น เท่ากับว่าหากดักฟังจริง ๆ ปริมาณทราฟฟิคข้อมูลจะเยอะกว่าปกติถึง 33 เท่าเลยทีเดียว เพิ่มค่าใช้จ่ายให้บริษัททั้งเรื่องแบนด์วิธและประมวลผล
ส่วนข้อที่สอง Martinez บอกว่าการที่แอปจะดักฟังตลอดเวลา มันถูกตรวจจับง่ายมาก จากการที่ตัวแอปกินดาต้าสูงเป็นปกติ รวมถึงการที่เฟซบุ๊กมีโครงการ Bug Bounty เปิดให้แฮกเกอร์ Whitehat หรือนักวิจัยความปลอดภัยล่าเงินรางวัลจากการค้นพบบั๊กด้วยแล้ว ถ้าหากเฟซบุ๊กทำจริง น่าจะถูกแฉไปนานแล้ว
อย่างไรก็ตาม Martinez ก็โต้แย้งตัวเอง (counter argument) เอาไว้อย่างน่าสนใจว่า มันก็มีกรณีอย่าง Alexa หรือ Google Assistant ที่พร้อมรับฟังเสียงผู้ใช้งานอยู่ตลอดเวลา เพียงแต่ว่าต้องมีคำเฉพาะเพื่อเรียกหรือ trigger word เพื่อให้ Alexa หรือ Google Assistant เริ่มฟัง บันทึกเสียง ส่งกลับเซิร์ฟเวอร์และประมวลผล
Martinez อธิบายว่าเฟซบุ๊กจะทำก็น่าจะทำได้ แต่มันยากและวุ่นวายมาก เขาบอกว่าตอนที่เขาลาออกจากเฟซบุ๊ก บริษัทมีคีย์เวิร์ดสำหรับการทำเป้าหมายโฆษณา (targeting system) อยู่หลักล้านคำ และก็น่าจะเพิ่มขึ้นเรื่อย ๆ ทว่าเฟซบุ๊กไม่ได้มี trigger word ในแบบข้างต้น หรือหากจะทำก็ต้องมาจัดกลุ่มคำ อาทิ Tiger Wood, The Masters, Augusta National Golf Course อยู่ในคีย์เวิร์ด Golf ขณะที่กระบวนการประมวลผล speech-to-text ก็ต้องทำในเครื่องสมาร์ทโฟนแทนด้วย เพราะจำนวนผู้ใช้มหาศาลเกินกว่าที่เซิร์ฟเวอร์จะรองรับ นำไปสู่อีกปัญหาคือสมาร์ทโฟนมีหลากหลายสเปค ตั้งแต่ราคาถูกไปจนถึงแพง
ไม่รวมกรณีว่าวิธีนี้จำเป็นต้องเข้าถึง API ไมโครโฟนตลอดเวลา ซึ่งก็จะติดเงื่อนไขว่าถูกจับได้ง่ายมากอย่างที่กล่าวไป
ทั้งนี้ทั้งนั้น ประเด็นที่บอกเฟซบุ๊กดักฟังผ่านไมโครโฟน เป็นคนละกรณีกับการที่เราอัดเสียง ส่งรูปภาพ พิมพ์ข้อความหรือโทรศัพท์พูดคุยกับเพื่อนผ่านแพลตฟอร์ม เพราะเฟซบุ๊กถือว่าเราไปใช้บริการและยินยอมมอบข้อมูลเหล่านี้ให้เอง และเฟซบุ๊กก็ระบุเอาไว้ในนโยบายอย่างชัดเจนด้วยว่าจะเก็บข้อมูลเหล่านี้
การแสดงโฆษณาของเฟซบุ๊กจะอิงอยู่กับข้อมูลเกี่ยวกับตัวเราที่เฟซบุ๊กมี ซึ่งมากเพียงพอที่เฟซบุ๊กไม่จำเป็นจะต้องเสียเวลา เสียทรัพยากรและเสี่ยงทำผิดกฎหมายไปดักฟัง โดยเฟซบุ๊กได้ข้อมูลผู้ใช้มาจาก 2 ส่วนหลัก ๆ คือ
ส่วนแรกแน่นอนว่าคือบนแพลตฟอร์มของเฟซบุ๊กเอง ไม่ว่าจะรูปภาพ ข้อมูลส่วนบุคคล เพศ อายุ เพจที่ไลค์ ซึ่งบ่งบอกความสนใจ คอนเทนท์ที่ไลค์ที่แชร์ หรือกระทั่งการเลื่อนอ่านฟีดไหนนาน ๆ เฟซบุ๊กก็รู้ว่าเราสนใจเรื่องนั้นมากเป็นพิเศษ รวมถึงว่าหากเราเปิดให้เฟซบุ๊กเข้าถึงตำแหน่งที่ตั้ง (location) หรือเช็คอินที่ไหนบ่อย ๆ ก็จะรู้ว่าเราชอบกินอาหารร้านไหน ชอบไปเที่ยวไหน
นอกจากนี้ location ไม่ได้ใช้แค่อ้างอิงความสนใจเราอย่างเดียวแต่ใช้เป็นปัจจัยในการยิงโฆษณาด้วยเช่นกัน เช่นกรณีที่ร้านอาหารเปิดใหม่กำลังทำโปรโมชัน แล้วตั้งเป้าหมายโฆษณาว่าให้ยิงไปที่คนที่อยู่ในรัศมีร้าน 2 กิโลเมตร ถ้าเราอยู่ใกล้ ๆ ก็อาจจะได้รับโฆษณานั้นไปด้วย
ส่วนที่สองคือข้อมูลเกี่ยวกับพฤติกรรมการท่องเว็บจากคุกกี้ โดยเฉพาะเครื่องมือที่เรียกว่า Facebook Pixel ซึ่งเป็นโค้ด JavaScript ที่เฟซบุ๊กให้เจ้าของเว็บเอาไปติดตั้งบนเว็บตัวเอง ทำให้เฟซบุ๊กรู้ข้อมูลพฤติกรรมการเข้าเว็บของเรา แม้ว่าเราไม่ได้เข้าในเฟซบุ๊กอยู่ก็ตาม เรียกได้ว่าออกนอกเฟซบุ๊กไปแล้ว เฟซบุ๊กก็ยังรู้ว่าเราไปทำอะไรต่อบ้าง
ข้อมูลสองส่วนข้างต้นเฟซบุ๊กไม่ได้เอาข้อมูลเราไปขาย แต่เอามาสร้างเป็นโปรไฟล์ความสนใจของแต่ละคนสำหรับใช้ในการยิงโฆษณามาหาเรานั่นเอง
คนที่เคยยิงโฆษณาผ่านเฟซบุ๊ก คงทราบกันดีว่าสามารถเลือกกลุ่มเป้าหมายตามความสนใจได้ (targeting) เช่น คนสนใจโทรศัพท์มือถือ, คนชอบฟังเพลง K-Pop, คนดูอนิเมะ ฯลฯ โดยเฟซบุ๊กสามารถสรุปความสนใจของเราจากข้อมูลทั้งใน (profile) และนอกเฟซบุ๊ก (pixel)
แต่นอกเหนือจากนั้น หากมีธุรกิจอื่นที่รู้จักเราอยู่แล้วและรู้ว่าเรามีความสนใจบางอย่าง (ที่เฟซบุ๊กเองก็ไม่รู้) เช่น เราเสิร์ชหารองเท้าบนอีคอมเมิร์ซ A ที่เราสมัครสมาชิกเอาไว้ แล้วยังไม่ซื้อ ทาง A ก็จะยิงโฆษณาไปที่เฟซบุ๊กโดยอิงจากอีเมลที่เราสมัครเอาไว้ ถ้าบัญชีเฟซบุ๊กเราใช้อีเมลเดียวกัน ระบบโฆษณาของเฟซบุ๊กจะทราบว่าทั้งสองบัญชีเป็นบุคคลเดียวกัน และแสดงโฆษณารองเท้ารุ่นนั้นซ้ำขึ้นมาบนเฟซบุ๊กอีกซักพักใหญ่ ๆ เพราะอยู่บนความเชื่อว่าเราสนใจสินค้านั้นอยู่แล้ว เหลือแค่การกระตุ้นให้ตัดสินใจซื้อเท่านั้น วิธีการนี้มีชื่อศัพท์ทางการตลาดเรียกว่า Retargeting Ads
ข้อมูลอีกส่วนที่นำมาทำ Retargeting ได้คือข้อมูลจากโลกออฟไลน์ที่แบรนด์ได้ข้อมูลเรามาจาก Data Broker แล้วนำมายิงโฆษณาเราบนเฟซบุ๊กอีกที
Data Broker คือบริษัทที่รวบรวมข้อมูลของเรา โดยเฉพาะพฤติกรรมจากโลกออฟไลน์อย่างบัตรสะสมแต้ม บัตรสมาชิก หรือกระทั่งบัตรเครดิต และข้อมูลที่เป็นสาธารณะ อาทิ ชื่อ ที่อยู่ เบอร์โทร บริษัทเช่น Datalogix ระบุว่ารวบรวมข้อมูลการซื้อสินค้าจากแบรนด์ต่างๆ มากถึง 1,400 แบรนด์โดยไม่ระบุว่าแหล่งข้อมูลเป็นแบรนด์อะไรบ้าง
วงจรที่เกิดขึ้นได้ก็คือ สมมติเราไปซื้อรองเท้าในห้าง เรามีบัตรสะสมแต้มที่มีข้อมูลระบุตัวตนว่าเป็นใคร ห้างก็จะขายข้อมูลอีเมล เบอร์โทร คู่กับสินค้าที่เราซื้อให้ Data Broker แล้วนำไปขายต่อให้กับอีคอมเมิร์ซ A ที่นำข้อมูลนี้มายิงโฆษณาบนเฟซบุ๊กอีกต่อ เช่น หากเราเพิ่งซื้อเสื้อกีฬาในห้าง ก็มีความเป็นไปได้สูงที่จะซื้อรองเท้าวิ่งจากอีคอมเมิร์ซ หรือสมัครฟิตเนสเพิ่มเติม เป็นต้น
ช่วงปีที่ผ่านมาเฟซบุ๊กปรับปรุงนโยบายเรื่องข้อมูลและโฆษณาให้มีความโปร่งใสขึ้นมาก จัดทำหน้า Ad Preference ของผู้ใช้แต่ละคน เราสามารถเข้าไปดูได้ว่าเฟซบุ๊กสร้างโปรไฟล์ความสนใจอะไรของเราเอาไว้บ้าง รวมถึงมีแบรนด์ไหนยิงโฆษณามาหาเราโดยตรง ซึ่งเฟซบุ๊กก็บอกเอาว่าเราถูกยิงโฆษณาอย่างเจาะจงจากใคร แม้จะไม่ได้บอกว่าแบรนด์นั้นใช้ข้อมูลชุดใดเพื่อยิงโฆษณามาหาเรา
ระบบโฆษณาของเฟซบุ๊กรองรับเงื่อนไขการยิงโฆษณาอย่างเจาะจงหลายรูปแบบ ตั้งแต่การเจาะจง ชื่อ-นามสกุล, นามสกุล, อีเมล, หมายเลขโทรศัพท์, เมือง, รัฐ, วันเกิด, หมายเลขประจำผู้ใช้เฟซบุ๊ก, และ Mobile Advertising ID
ขยายความเรื่อง Mobile Advertising IDs เนื่องจากการใช้งานแอปในสมาร์ทโฟนไม่มีการเก็บคุกกี้ ดังนั้นแบรนด์หรือแอปที่แสดงโฆษณาจะติดตามและอ้างอิงตัวตนผู้ใช้งานจาก Mobile Advertising IDs แทนซึ่งมีอยู่ในทุกเครื่องไม่ว่าจะแอนดรอยด์ (AdID) หรือ iOS (IDFA) หมายเลขนี้สามารถรีเซ็ตได้ทุกเมื่อที่เราต้องการ รวมถึงสามารถปิดการทำงานได้ด้วย
แนวทางการยิงโฆษณาอย่างเจาะจงเช่นนี้เป็นแนวทางที่เว็บไซต์ส่วนมากใช้เหมือนกัน ไม่ว่าจะเป็นกูเกิล, ทวิตเตอร์, หรือ LinkedIn แม้เงื่อนไขที่รองรับจะต่างกันไปก็ตาม เช่น LinkedIn นั้นรองรับการโฆษณาอย่างเจาะจงตามนายจ้าง
ด้วยเหตุผลทั้งหมดที่กล่าวมาทำให้ผมเชื่อว่าเฟซบุ๊กไม่น่าจะดักฟังเราผ่านสมาร์ทโฟน เพราะเสียทั้งทรัพยากร เสี่ยงทั้งกฎหมาย และตรวจจับง่าย ประกอบกับว่าเฟซบุ๊กมีข้อมูลเกี่ยวกับตัวเรามากเพียงพอแล้วนั่นเองครับ
ลองนึกภาพว่าหากเฟซบุ๊กถูกแฉว่าแอบดักฟังบทสนทนาของผู้ใช้งาน ความเสียหายกับบริษัทที่เกิดขึ้นจากกรณี Cambridge Analytica เมื่อปีที่แล้วน่าจะกลายเป็นเรื่องเด็ก ๆ ไปเลย เพราะเฟซบุ๊กจะโดนรุมถล่มจากทุกฝ่ายแน่นอน โดยเฉพาะฝ่ายการเมืองจากประเทศต่างๆ ที่กำลังไม่พอใจเฟซบุ๊กอย่างมากในช่วงไม่กี่ปีมานี้
Comments
บ. ระดับโลกไม่น่าจะไร้ศิลปะถึงขนาดมาดักฟังกันแบบง่อยๆ อยู่แล้ว
มีอยู่ครั้งนึงที่พูดเรื่องกล้องหน้ารถ ตกเย็นเจอโฆษณากล้องหน้ารถเลย
(มโน)คิดว่าไม่น่าใช่ fb แต่แต่สงสัยกูเกิลแทนน่ะสิ
มีพี่คนนึงที่ออฟฟิส พูดถึงเรื่องเหาของลูก สักพักโฆษณายาฆ่าเหาโผล่มาในเฟสบุคเลย
แต่ผมไม่เคยเจอเหตุการณ์ที่ว่าคุยเรื่องอะไรแล้วมีโฆษณาเรื่องนั้นๆ โผล่บนเฟสบุคนะ ถ้ามีก็อาจจะดีในมุมของผมมั้ง
ไอ้ที่แย่คือวันดีคืนดีมีแต่โฆษณาดิลโด้หลากหลายยี่ห้อมาโผล่บนเฟสบุคผมนี่แหละ หมอนสาว 2d ก็โผล่มาบ่อย
ผมก็เหมือนกัน ปกติก็พูดคุยแต่เรื่องเกมมือถือ แต่ไหงมีแต่โฆษณาขายของอุปโภค กับโฆษณาการพนันขึ้นมาเพียบ (โดยเฉพาะตอนกลับบ้าน) ส่วนโฆษณาสิ่งที่สนใจจริง ๆ จะขึ้นมาเฉพาะตอนผมพิมพ์ค้นหาของชิ้นนั้นบ่อย ๆ เท่านั้น
"เหตุผลเชิงเทคนิค 2 ข้อ.. 1.กินที่เก็บ Data ฝั่ง Facebook , 2. ตัวแอปกินดาต้าสูงเป็น สูงมาก..."
แปลว่า ถ้าใช้ AI ที่เครื่อง User เพื่อฟัง Microphone แล้วแยกเป็น Keyword ออกมา, ส่งกลับ Server ทุกๆ ชั่วโมง ก็คือ ไม่ได้อยู่ในคำจำกัดความของคำว่า "ดักฟัง" แล้วใช่ไหมฮะ :D
ถ้าคิดว่าเป็นแบบนี้ลองปิด persmission ตัว mic ไปแล้วดูว่ายังมีผลอยู่หรือเปล่าก็ได้ครับ
ไม่ก็แงะโทรศัพท์ออกแล้วถอดไมค์ออกไปเลย (ฮา) เวลาคุยค่อยเสียบ headset
คือ แค่สงสัยครับ อ้างอิงตามเนื้อข่าว เห็นบอกเหตุผลด้านเท็คนิค 2 ข้อ (ซึ่งเกี่ยวกับ Data หลักๆ ทั้ง 2ข้อ)
ซึ่ง ผมคิดว่า ถ้าต้อง Implement จริงๆ ระดับ Facebook แล้ว ปัญหาที่บอกว่า ใช้ Data เยอะ มันพอจะแก้ได้ด้วยแนวทางอื่นๆหน่ะครับ
ผมว่าถ้าสงสัยต้องพิสูจน์ครับว่าทำได้จริงหรือเปล่า :)
ถ้าผู้ผลิตทำ hardware switch มาหลายๆรุ่นก็ดีนะครับ เหมือน librem 5
ผมว่า เรื่องการใช้ AI ในการ interpret keyword ที่ขาดของบทความนี้เป็นสิ่งที่ทำให้บทความนี้ดูไม่ครบถ้วนไปเลยนะ(อย่างน้อยในมุมมองของผม)
เพราะ Mic Permission มีผลมาก กับการปรากฎของโฆษณา ... ถึงขั้นว่าโฆษณาที่โชว์ของการเปิดไมค์กับปิดไมค์ โทนจะต่างกันชัดเจนเลย คือถ้าลองใช้กันสักครึ่งเดือน ระหว่างเปิดกับปิดไมค์เทียบกับ การเปิดจะทำให้ได้โฆษณาใกล้ตัวกว่ามาก
ไม่ว่า Facebook จะมีข้อมูลจากองค์ประกอบของเรามากขนาดไหน แต่สิ่งที่เฟสบุ๊คไม่สามารถทำนายได้แน่ๆ คือ การเกิดเหตุฉุกเฉิน / การเกิดอุบัติเหตุ ที่เกิดขึ้นจาก Offline
มันเป็นไปไม่ได้ที่จะโยงข้อมูลพวกนี้เข้ากับโปรไฟล์ (ถึงจะมีมากขนาดไหนก็เหอะ)
บางทีมีของตกใส่รถ ... แค่คุยกันเอง แต่ก็มีสินค้าหมวดนี้งอกมาแล้ว เพราะหมวดนี้เราไม่ได้หาเพิ่ม บางทียังไม่ทันติดต่อประกันด้วยซ้ำ และบางครั้งคนที่เราเจอก็เป็นบุคคลที่สาม "ที่ไม่มีเส้น relationship ถึงกันเลย"
บางทีหกล้ม .. ยังไม่ได้ทำอะไรเลย แค่พูดกัน ก็มีข้อมูลโฆษณาบางอย่างงอกมา
คำแนะนำบางเรื่องเกิดจากการพูดเป็นเสียงของบุคคลที่สาม (ในเรื่องที่เราไม่ได้ interest และคนๆนั้นไม่เกี่ยวกับเราด้วยซ้ำ)
บางทีเดินเข้าร้านค้า(แบบเดินดูของ window shopping) ปิดทั้ง wifi/location service แค่คุยกับเจ้าของร้านถึงสินค้านั้น ไม่ถึงสองสามนาทีก็มาโผล่บนโฆษณาในแอพแล้ว ทั้งที่ร้านนั้นไม่เคยเข้ามาก่อนเลยด้วยซ้ำ .. แต่โฆษณาในร้านประเภทที่เข้าแต่ไม่พูดถึงกลับไม่โผล่ก็มี
และที่มองว่าเป็น flaw ก็เพราะว่้าเดี๋ยวนี้ Voice Recognition Pattern มันเล็ก (แอพเฟสบุ๊คใหญ่พอที่จะซ่อนของเล็กๆชิ้นนี้เข้ามาได้ง่าย และการรันมันตลอดเวลาในระดับใกล้เคียงกับ OK Google ก็ง่าย .. ถ้าเราไม่ได้ส่ง ข้อมูลทั้งหมดไป แต่ส่งเพียงบางส่วน มันก็นับว่าฟังเราตลอดเวลาอยู่ดีหรือเปล่า)
ปล. 1 ผมเฉยๆกับการเปิดไมค์ เพราะผมก็ใช้การพูดลอยๆบางเรื่องไว้ เพื่อที่จะไม่ต้องหาเอง เดี๋ยวมันมาเอง อยู่บ่อยๆ ซึ่งมันได้ผลเสมอ
มันเลยทำให้รู้สึกว่า ถึงจะไม่ใช้คำว่าดักฟัง
แต่ยังไงก็เชื่อว่ามี Voice recognition ทางนึง
ปล. 2 ... https://9to5google.com/2016/03/11/google-accurate-offline-voice-recognition/ ย้อนไปสามปีที่แล้ว ระบบสำหรับการฟังแบบ Offline มีขนาดแค่ 20MB เอง และรันได้แบบเงียบๆด้วย Google has created a 20.3MB system that is 7x faster than a system connected to the Internet and only has a 13.5% word error rate. It was implemented and tested on a two year old Nexus 5 with a quad-core 2.26GHz processor and 2GB RAM ... ซึ่งถ้าเราไม่ได้ต้องการความ "เป๊ะ 100%" แค่ต้องการคำสำคัญที่เกิดบ่อยๆ ... ใช้ local recognition คำสำคัญโมดูลเล็กๆ ก็มากพอจะหาโฆษณาแล้ว ....... และโมดูลที่เทรนนั้นคือสามปีที่แล้ว ถ้ามาคิดว่าเป็นปีนี้ ที่โลกผ่านการเทรนโมเดลมาอย่างหนักหน่วง แถมมือถือเร็วขึ้นกว่าปีนั้นอีกกี่เท่าไม่รู้ voice recognition มันควรจะทำงานได้แบบแทบทันทีทันใดด้วยซ้ำ
และถ้าข้อมูลที่ส่งมีแค่ keyword .. ต่อให้ encrypt หรืออะไรก็ตามที รอบนึงที่เราเปิดเฟส มันก็จะกินดาต้าเพิ่มแค่ 10-15 ไบต์ ซึ่งข้อมูลขนาดนี้ แนบไปกับ auth-id ก็มากพอแล้วที่จะไม่มีใครตรวจเจอแล้ว (auth string ของ เฟสบุ๊คยาวระดับ 60-80 byte การจะใส่อะไรเข้าไปใน encrypted string มันง่ายอ่ะ pad ด้วยอะไรที่เข้ารหัสไปก็จบ)
ลองสมมติ fb มี dictionary คำที่ใช้โฆษณา ขนาด 10 ล้านคำ ที่ฟังแล้ว hash ด้วยขนาด 6-8 ไบต์ดูสิครับ ข้อมูลที่ต้องส่งจริงๆ มันก็จะน้อยจนเป็นเศษเสี้ยวของข้อมูลรูปภาพหรือหน้าเพจเลยด้วยซ้ำ
ซึ่งแค่ ปล.2. ที่การใช้โมเดลเทรนขนาดเล็ก ก็มากพอจะฟังตลอดเวลาแล้ว และข้อมูลที่ส่งก็เล็กจนไม่มีนัยยะ มันทำให้ argument หลักของบทความที่บอกว่าต้องกิน data เพิ่มขึ้นมาก มันหมดไปได้โดยปริยายเลยอ่ะครับ
ที่มาของ app ใหญ่สินะ ทำได้ขนาดนี้
ผมว่าเรื่องราวประสบการณ์ว่าเคยเจอ วัดได้นี่เหมือนเรื่องผีตามโรงแรมเลยครับ คนเจอ คนได้ยินว่ามีคนเจอเต็มไปหมด ทำซ้ำไม่ได้สักที
lewcpe.com, @wasonliw
ข้อ 1. ตรงนี้ผมก็อาจจะค้านลำบาก เพราะลึกๆก็เชื่อว่า เปิดไมค์ได้อย่างจำกัด ยิ่งแอนดรอยด์ยุคหลังยิ่งปิดสนิทและน่าจะมี log ให้ใครตรวจบ้างทางใดทางนึงอยู่แล้ว ... (และอันนี้ก็อยู่ที่มุมมองว่า ปิดหลังเกิดเหตุ หรือปิดเพื่อป้องกันเหตุ)
ข้อ 2. ผมคิดว่าสุดท้าย เราไม่ได้ต้องการความ "แม่น" ขนาดนั้นนะครับ เราแค่ sampling ข้อความไปเรื่อยๆ เจอคำที่มีนัยยะประมาณนึง/ซ้ำบ่อยประมาณนึง ก็ค่อยส่งไปเทียบกับ interest ก็พอแล้ว ... เราไม่ได้ต้องการความแม่นยำในระดับ "เป๊ะทั้ง intent ทุกคำ เก็บได้ครบหมดทั้งโทน" แบบนั้น เราแค่ สุ่มฟังแล้วได้คำมา ไม่ต้องถูกเป๊ะหมดก็ได้ แต่คำที่ได้มาก็ไปเก็บสะสมไว้เฉพาะคำที่ตรงกับ marketing term ที่มีนัยยะ ... คือความแม่นยำไม่ใช่สิ่งที่จำเป็นขนาดนั้นเลย ถ้าเรามีสิ่งที่แม่นยำอื่นช่วยชี้ว่าของที่เราฟังได้มัน relevant แค่ไหน เหมือนเวลาไปฟังงานสัมมนา บางช่วงเราก็ฟังผ่านๆ แต่พอประกอบกับสไลด์ ประกอบกับอย่างอื่น ... ต่อให้ตรงนั้นมันฟังพลาดไปเยอะ มันก็ยังพอจับแพะชนแกะให้ได้ของที่อยากได้ ได้อยู่ดี ...
ถ้ามันเป็นงาน sampling (แบบเก็บข้อมูลด้วยแบบสอบถาม) มันก็ไม่ต้องเป๊ะไม่ต้องแม่นอ่ะครับ เก็บแค่ให้ได้บริบทแวดล้อมก็พอ ... และจริงๆภาษาที่ต้องเก็บ model ไว้ก็มีแค่อังกฤษและไทย (สำหรับคนไทย, หรืออังกฤษ+native สำหรับคนชาติอื่นๆ) ซึ่งในกรอบของ app-size+user-data ขนาด 500MB++ มันก็เหลือๆอยู่แล้ว .... และถ้าเราเอาคำว่าเพื่อ Privacy ของผู้ใช้งาน ข้อมูลที่เก็บในเครื่องจะถูกเข้ารหัสไว้ เอาแค่ตรงนี้ก็ยากมากแล้วที่จะขุด storage/in-memory ออกมาดูว่าแท้จริงแล้วแอพนั้นกำลังทำอะไรกับเราหรือเก็บอะไรไว้บ้าง
ข้อ 3. ในเมื่อถ้าตามข้อ 2 ในความคิดผม เราไม่ได้ต้องการโมเดลเทพขนาดนั้น มันก็น่าจะยังพอเป็นไปได้อยู่หรือเปล่าครับ
ผมไม่ได้การันตีหรือแบบยืนยันมั่นใจว่าดักฟังแน่ๆ เอาจริงๆผมก็เห็นด้วยในเนื้อหาว่าก็ไม่ถึงกับต้องดักฟังก็มีข้อมูลมากพอจะโชว์ relevant ad แล้ว ... เพียงแต่ว่า ก็ยังรู้สึกว่ามันไม่อยู่ในระดับที่ debunk ได้หมด หรือเป็นไปไม่ได้เลย อะไรขนาดนั้นอ่ะครับ ... ยิ่งกับบริษัทที่ในอดีตก็มีข่าวว่า "แอบทำ" หรือ "แอบข้ามเส้น" ตั้งหลายข่าว บางทีมันก็อาจจะมีความค้างคาใจอยู่บ้าง
ขออนุญาติเสริมฮะ เห็น Text-to-Speech ล่าสุดที่ไปวิ่งบนเครื่อง User
ราวๆ โมเดล แค่ 80mb เองฮะ
ซึ่งส่วนตัวยังไม่เคยลองใช้นะฮะ เลยไม่รู้ทำได้แค่ไหน เคยใช้แต่ Text-to-speech API ของ Google (แบบ Free) ซึ่งบอกเลยว่า ก็ยังมีการบ้านอะไรที่ต้องทำอีกเยอะ หากต้องการให้มันแม่นยำ.
https://www.blognone.com/node/108606
อันนี้คือข้อ 3 ของผมล่ะครับ มันต้องมีไฟล์โมเดลนี้อยู่สักที ใน APK หรือโหลดมาทีหลัง
จะเทพมากขนาดที่ว่าเฟซบุ๊กแอบลบทิ้งเป็นระยะ วันดีคืนดีก็แอบโหลดกลับมารันใหม่ เทพขนาดโหลดมาโดยไม่มีใครสังเกต ลบทิ้งก่อนมีคนเจอเสมอ
คนทำก็น่าจะเทพระดับโลกจริงๆ
lewcpe.com, @wasonliw
โมเดลเทพไม่เทพมันต้องมีตัวตนครับ ต้องมีไฟล์โมเดลแน่ๆ ถ้าเล็กมากระดับ kB แล้วโหลดใหม่ทุกครั้งหลังโดน kill นี่อาจจะกลับไปข้อสอง ว่าเฟซบุ๊กมีเทคโนโลยีล้ำหน้าคนอื่นไปอย่างน้อย 5-10 ปีแล้ว
lewcpe.com, @wasonliw
ตรงนี้ผมว่ามันซ่อนได้นะครับ
ตราบเท่าที่เราเอาไฟล์ใส่ไว้ใน user-data หรือ cache หรืออะไรก็ตาม ในรูปแบบที่เป็น encrypted ... ไฟล์ 10MB-20MB ก็เท่ารูปรูดเดียวเอง แล้วเดี๋ยวนี้เวลาเก็บ cache มันก็มาเป็น hexadecimal filename กันหมด ต่อให้ analyze ทุกไฟล์ เราก็แยกอันที่มันเป็นข้อมูลเฉพาะหรือเข้ารหัสแล้วออกมาไม่ได้อยู่ดี
โมเดลขนาด 8MB .. ว่ากันตามตรงก็รูปถ่ายรูปเดียวเอง (ใน Gboard ภาษาที่เล็กสุดคือเกาหลีกับญี่ปุ่น ซึ่ง offline model ขนาดแค่ 9.1 MB เองนะครับ นี่คือระดับใช้งานทั่วไปได้ด้วยซ้ำ แต่ถ้าเราจะทำโมเดลเพื่อให้เข้ากับคำที่เป็นคำโฆษณา คือเทรนบนคำคีย์เวิร์ดโฆษณาล้วนๆ มันก็ควรจะได้ขนาดราวๆนี้แหล่ะ)
concern ผมเลยอยู่ในบริบทที่ว่า ก็ถ้าที่เก็บข้อมูลมันไม่ได้จำเป็นต้องวางเป็นไฟล์ให้เห็นชัดเป๊ะขนาดนั้นก็ได้ ก็ถ้ารู้ว่าเป็นของที่ต้องซ่อน เราก็ต้องทำอะไรซักอย่างเพื่อนซ่อนมันไว้ จะรูปแบบไหนสักรูปมันควรก็ซ่อนได้ เหมือนสมัยที่ยุคนึงเราก็ซ่อน executable ใน jpg หรือซ่อนโฟลเดอร์ให้หายไป ถึงมันจะมีอะไรผิดประหลาดอยู่ก็ต้องถอดรหัสออกมา .. ซึ่งถ้าถึงขั้นดักคีย์ที่ใช้ในการถอดไฟล์นั้นได้ ผมว่ามันก็ต้องเป็น expert vs expert อยู่ดี ... lib ที่เกี่ยวกับพวกนี้หลายตัวก็เป็นส่วนหนึ่งของสิ่งที่ต้องใช้อยู่แล้ว
ซึ่งผมว่าเทคนิคการซ่อนอะไรสักอย่าง ในไฟล์อะไรสักไฟล์ ใน memory อะไรสักอัน เพื่อรัน (ด้วย permission ที่ valid) มันเป็นวิธีการทั่วไปสำหรับการรัน backdoor/trojan อยู่แล้ว ... ถ้าพิจารณาในมุมว่าเทคโนโลยีซ่อนทั้งหลายทั้งปวงมีกันมาสิบกว่าปีแล้ว + ถ้ามันพัฒนามาเรื่อยๆอย่างไม่หยุดยั้ง การซ่อนอะไรซักอย่างในแอพของตัวเอง ซึ่งขอ permission ที่เกี่ยวข้องมาครบถ้วนหมดแล้ว มันควรจะง่ายกว่าการทำ backdoor/trojan ที่ต้องเอาไปซ่อนบนแอพของคนอื่น อีกนะครับ
แล้วตัว FB เองก็มี Update services ที่โหลดอะไรมาอัพเดทตัวเองโดยไม่ผ่าน play store มาสักพักแล้ว อยู่ๆก็ feature update เองได้ ... การจะเอาอะไรพวกนี้โหลดมาเงียบๆ ในรูปแบบที่เราอาจจะคิดว่ามันก็คือไฟล์ทำงานไฟล์นึง (จะฝังใน binary มาเลย หรือจะมาในรูปแบบอื่น) มันก็ทำได้
แต่ก็ใช่ว่า การจะเอามันไปซ่อนใน memory เลยมันก็อาจจะซ่อนยากขึ้นก็จริง แต่การจะไป memory debug ว่าโปรแกรมอื่น (ที่ถูกเข้ารหัสมาแล้ว) กำลังทำอะไรอยู่ มันก็ไม่ใช่เรื่องสำหรับคนทั่วไปอยู่ดีหรือเปล่าครับ ?
แม้กระทั่งการซ่อน memory บางทีการเลือกว่ารันหรือไม่รันอะไรจาก orientation / location ก็เป็นออพชั่นที่บางโปรแกรมเคยเลือกทำเช่น ... ถ้ายกมือถือมาดู face unlock จะทำงาน ... ถ้ามือถืออยู่ใน pocket ที่เซนเซอร์แสงถูกปิด คำสั่งนั้นจะถูกทำงาน ... มันมีเงื่อนไขในการซ่อนการทำงานบางอย่างเยอะแยะ (พอๆกับที่บริษัทขายมือถือก็ซ่อนบางสิ่งไว้เวลาขาย benchmark score อ่ะ .. สุดท้ายก็จะมีคนเจอ แต่จะเจอช้าเจอเร็วก็อีกเรื่อง)
ใน app มันก็มีส่วนที่เป็น blackbox นึงอยู่แล้ว ... นอกจากมันเป็น opensource ยังไงเราก็แงะได้ไม่หมดอยู่ดี
ผมแค่มองว่ามันมีวิธีการทำให้สิ่งเหล่านี้เกิดขึ้นได้อ่ะครับ
ซึ่งการเชื่อว่าของสิ่งนี้สามารถทำให้เกิดขึ้นได้ไม่ทางใดก็ทางหนึ่ง
ก็จะทำให้หัวเรื่องของประเด็นว่า ใช้ data/storage เยอะมาก ลดน้ำหนักลงไปด้วย
แต่บทความนี้ใช้การสร้างเหตุผลบนสองข้อนั้นเป็นหลัก
และถ้ามันยังเหลือ possibility อยู่ ผมว่าการฟันธงว่า ไม่มีแน่ๆ มันดูไม่น่าจะทำได้
(ประเด็นผมแยกกันระหว่างฟันธง กับ ให้แนวโน้ม 70/30 80/20 90/10) คือสุดท้ายถึงผมจะเชื่อว่า
ในยุคนี้มันเก็บยาก แต่มันก็ไม่สามารถใช้ headline แบบ "สรุปคือไม่ดักฟังเพราะไม่จำเป็น" ได้อ่ะครับ
ประโยคนี้มันต้องมีระดับ 95%-100% เลย คือ reverse engineer กันมาครบแล้วอ่ะ
(ถึงจะบอกว่าในเนื้อหาย่อยจะมีคำว่า คิดว่า น่าจะ อะไรทำนองนี้อยู่แต่หัวก็ฟันธงไปอยู่ดี)
ในความรู้สึกผมมันดูมีหลายอย่างที่พอจะทำได้อ้อมๆเพื่อให้ได้สิ่งเดียวกัน
ทั้งนี้ทั้งนั้น สำหรับผมมันเป็น "neither confirm nor deny" (NCND) ว่าเค้าทำหรือเปล่ามากกว่า แม้จะมีแนวโน้มว่าไม่จำเป็น
ในอีกด้าน เพราะไม่จำเป็นต้องทำจึงไม่ทำ
มันเหมือนกับประโยคการเมืองว่า รวยแล้วไม่ต้องโกงก็ได้
คือตรงนี้มันบางเกินไปกว่าจะใช้เป็นหัวข้อสรุปได้
เคยไหมครับ เวลาคนเราเถียงกัน เราก็ขุดเรื่องอดีตมานู้นนี้นั่น ... และบ่อยครั้ง trigger เราก็ไม่ใช่เรื่องพวกนั้น ... เวลาเฟสบุ๊คโชว์ว่าทำไมถึงโชว์โฆษณา มันอาจจะเป็นเพราะเราไปไลค์เพจนี้ เราเข้าไปดูเพจนั้น ... ก็เหมือนเราขุดเรื่องอดีตมาพูดให้มีน้ำหนัก ... แต่ "ณ ขณะนั้น เวลานั้น นาทีนั้น" อะไรที่ทำให้ trigger ตัวนี้มีน้ำหนักมากขึ้นเป็นพิเศษ ? ซึ่งเวลาเราเถียงกัน เราไม่ได้ยกเหตุปัจจุบันขึ้นมาเถียงไง เราเล่าแต่เรื่องเก่าๆ บางทีอาจจะเพราะแค่คู่สนทนาเราชักสีหน้าใส่เฉยๆ เราหงุดหงิดเราก็เลยขุดเรื่องเก่ามาด่า ... ซึ่งฟังดูมันก็สมเหตุสมผล แต่เหตุจริงเค้าอาจจะไม่รู้เลยก็ได้
หรือทะเลาะกับแฟน ... ไม่นี่ฉันไม่ได้งอนอะไรเลย .... แต่เรื่องที่ยกมาไม่เกี่ยวกับเรื่องที่งอนเลย แต่ฟังดูแล้วก็ทำให้เข้าใจไปว่ายกมาเพราะอันอื่นก็มี
xx wants to reach people who may be similar to their customers.
xx trying to reach people Facebook thinks are interested in Home, House and more.
xx trying to reach people who speak English (UK), Thai and English (US).
xx trying to reach people, ages 28 to 45.
xx trying to reach people whose primary location is Bangkok, Bangkok.
นอกจากที่ผมไปซื้ออุปกรณ์มาซ่อมบ้านและพูดคุยกันกับคนที่บ้านในช่วงเวลานี้แล้ว
ไม่มีพฤติกรรมออนไลน์ อะไรเลยที่ "โฆษณาชิ้นนี้ ต้องขึ้นมาในเวลานี้"
ทำไมน้ำหนักของอันนี้ จึงมีมากกว่าโฆษณาอันอื่นๆ ขึ้นมา ... ในช่วงเวลานี้พอดี
ad interest ผมใน facebook มีหัวข้อรวมกันร่วมครึ่งพัน เผลอๆจะถึงพันรายการ
อะไรไที่ทำให้ specific ว่าวันสองวันนี้ผมกำลังจะทำอะไรกับบ้าน ทั้งที่ผมและคนที่เกี่ยวกับผม
ไม่ได้หาข้อมูลเพิ่มเลยนอกจากการคุยกันเอง ของก็ไปซื้อมาจากห้างที่ขายของทุกประเภท ไม่เจาะจงด้วย ซุปเปอร์มาร์เก็ตทั่วไปนี่แหล่ะ
องค์ประกอบอื่นๆมีครบ แต่ trigger จริงๆคืออะไรล่ะ อันนี้ต่างหากที่เป็น information ที่หายไป
และที่คนเค้าเชื่อกันเยอะ เพราะว่า voice recognition มันดู fit in ไงครับ
ย้ำอีกทีครับ ผมไม่ได้คิดว่าเค้าอัดหรือไม่อัด แต่ผมก็ไม่สามารถฟันธงลงไปว่า "สรุปคือไม่ดักฟังเพราะไม่จำเป็น"
เพราะเนื้อหาการสนทนาในระยะเวลาใกล้ๆนี้ มันเป็นเนื้อหาที่มีน้ำหนักในการเลือกหัวข้อสนทนาหรือโฆษณาสูงครับ การทำสิ่งนี้มันจะทำให้ได้ effect ที่ดีกว่าการไม่ทำเยอะ ถ้าสามารถทำได้แนบเนียนและมิดชิด .... แต่ไม่ทำก็มีข้อมูลมากพอสมควรแก่การแสดงผลอยู่ดี
ปล.น่าจะตอบเพิ่มไม่ได้แล้วสำหรับวันนี้
ปล.2. ส่วนตัวผมถือว่าถ้าจะใช้คำว่า myth buster กันในเชิงวิชาการ มันต้องมั่นใจระดับ 100% จริงๆว่าไม่ได้ทำแน่ๆ ... ผมมองว่าบทความชิ้นนี้ดีนะครับ เพราะในเชิงเทคนิคแล้วเฟสบุ๊คก็ "น่าจะ" ทำเช่นนี้ เพียงแต่การการันตีว่าเป็น mythbuster ในของที่เราก็ reverse engineer ได้ไม่ครบ และไม่รู้กระบวนการภายในทุกขั้นตอนที่แอบรันอยู่ มันดูเหมือนมองข้ามความเป็นไปได้ทุกชนิดไป .. และมันยังเป็น featured content ด้วย
ดักฟังหรือไม่ไม่รู้ แต่ที่มันรู้ความสนใจเราได้ แล้วเราไม่รู้ว่ามันเอา Data Point มาจากไหนกันแน่น่ากลัวกว่าอีก
เขียนได้อ่านสนุกมากเลยครับ - -)b
+1 เรื่อง in-memory services ครับ ผมว่าที่บทความสรุปออกจะด่วนสรุป
ผมนั่งอ่าน comment (ที่ยอมรับว่ายาว แต่ได้ข้อคิดไม่น้อยเลย) แล้วผมมีข้อสงสัยอีกอย่าง:
ผมว่าเรื่อง storage ที่บทความยกมานี่ออกจะ overestimate ไป เอาจริงๆ เราจำเป็นต้อง track ทุกคนจริงๆ เหรอ? เพราะเป้าหมายของการโฆษณาสำคัญที่การสร้าง transactions จากโฆษณา เรา track แค่คนที่มีเป้าหมายก็น่าจะมากพอ พวกบอทรัสเซีย พวกคนที่ไม่น่าจะซื้ออยู่แล้ว การเอา model มารันก็ไม่น่าจำเป็นนะครับ
บล็อกส่วนตัวที่อัพเดตตามอารมณ์และความขยัน :P
ไม่เคยเจอประสบการณ์ Facebook เลย รู้สึกว่า Google น่ากลัวกว่าเยอะ
เคยฟัง argument นี้ทาง Reply All
โดยส่วนตัวผมคิดว่ากับคนส่วนใหญ่ก็มาจาก Facebook Pixel นั่นแหละ ไม่ว่าจะมาจากเราเอง หรือมาจากเพื่อนเราแล้ว Facebook มันจับ location เราอยู่กับเพื่อนคนนี้
แต่สิ่งที่ทำให้คนยังไม่เชื่อ 100% คือมันมีเรื่องแบบเราคุยกับแบบ offline ในเรื่องที่เราไม่เคยค้นหาบน online ไม่เคยไปซื้อของที่ร้านไหน แค่คุยกันเฉยๆ แล้วมันก็โผล่มา
ถ้าอันเดียวกันกับที่ผมฟัง คนที่ไปพูด Reply All คือ Martinez นี่แหละครับ
ความรู้สึกของผมก็ประมาณนี้เลย เชื่อครึ่งไม่เชื่อครึ่ง ที่พิลึกสุดๆ คงจะเป็นตอนที่ไปดูเก้าอี้ลดหน้าห้าง โดยที่ไม่ได้ไปคุยอะไรกับใครเลย แต่คิดว่าคงมาจากข้อมูลหลายๆ อย่างของคนที่ไปด้วย(ไม่ได้ดูเก้าอี้ด้วยกัน) รวมถึง location
ที่ผมเจอกับเฟซบุ๊คคือ ตอน 10 โมง พูดถึงหนังสือชีวิตเปลี่ยนได้ด้วยกระเป๋าสตางค์ใบเดียว ตอนเที่ยงคอนเทนต์ที่มีเนื้อหาในรูปภาพเขียนถึงหนังสือชื่อนี้โผล่ขึ้นมาเฉยเลย มันจะบังเอิญไปรึ ไม่น่าใช่
แต่ถ้ากูเกิ้ลนี่ชัดเจน มีเด็กมาคุยเรื่องเกม free fire วันต่อมาฟีดในกูเกิ้ลมีแต่เกมนี้เต็มไปหมด
ผมไม่เคยคิดว่า facebook ดักฟังแหะ แต่ผมเชื่อว่า google ดักฟังแล้วเอาไปขายให้ facebook มากกว่า
บ้านผมใช้ Google home mini มือถือ Android เปิด Google assistance ไว้ บางครั้งผมลองทดสอบคีย์เวิดที่ไม่เคยค้นหาไม่เคยใส่ใจไว้เลยเช่น เครื่องดูดฝุ่น ผมลองพูดวน ๆ ซ้ำ ๆ ก่อนเข้านอน เครื่องดูดฝุ่น อยากได้เครื่องดูดฝุ่น ช่วงบ่าย ๆ ก็มีโฆษณาเครื่องดูดฝุ่นมาในเฟซบุคผมนะ
แต่บางอย่างที่ไกลตัวมาก ๆ อย่าง น้ำหอม ลองพูดแล้วไม่มาแหะ เดาว่า AI น่าจะเลือกคีย์เวิดเหมือนกัน
ส่วนของแฟนใช้ iPhone ไม่มานะ ทั้งเครื่องดูดฝุ่นทั้งน้ำหอม
ปล เท่าที่สังเกตุหลังจากย้ายจาก iPhone มาแอนดรอย โฆษณามันมักจะตรงจริตของผมมากกว่าแหะ ไม่ว่าจะแค่พูดหรือคุยกับเพื่อนในแชท ต่างกับ ตอนใช้ iPhone ซึ่งตอนนี้ผมโอเคนะ อย่างน้อยก็เจอโฆษณาที่เราสนใจมากกว่าอะไรก็ไม่รู้ 555
iPhone มันไม่มีให้ทำงานเบื้องหลังได้มากเท่า android ครับ
ลองปิดสิทธิ์ไมโครโฟนที่ facebook, messenger และโปรแกรมในเครือดูครับ
หรืออย่างตอนผมใช้ huawei มันก็จะบอกตลอดว่า
facebook พยายามทำงานเบื้องหลังเปลืองแบต
ก็ตั้งให้มันปิดตลอด ไม่ยอมให้ทำงานเบื้องหลัง ก็เริ่มหาย ๆ ไป
อีกตัวที่โดนฟ้องบ่อยคือ bluetooth ครับ พยายาม scan บ่อยมาก
เดาว่าถ้าดักเครื่องเราไม่ได้ก็ดักจากเครื่องเพื่อน
แล้วถ้าเราอยู่ใกล้ ๆ เพื่อนคนนั้น ก็อาจจะกำลังคุยเรื่องเดียวกันอยู่
แล้วไม่รู้ว่าเขาเก่งขนาดเอา bluetooth มา search wi-fi ด้วยหรือป่าว
เพราะว่าตามทฤษฎีแล้วมีส่วนที่ใช้คลื่น 2.4 เหมือนกัน
อาจจะแกะได้ว่าอยู่แถวไหนเหมือนกัน
เดาล้วน ๆ
เห็นด้วยเลยครับว่าน่าจะมาจาก Google มากกว่า
แค่ location นี่ แค่หยุดจ้องสินค้านึง 4 วินาที ภายในวันนั้นมี ads สินค้านั้นมาเลย
google ตัวดี
ก็ไม่คิดว่าจะทำงานตลอดเวลานะ เปิดมาแค่แว๊ป ๆ ก็ได้
ขนาด shazam เปิดแป๊ปเดียวยังรู้เลยว่าเพลงอะไร แถมบางทีเสียงสภาพแวดล้อมไม่ดีด้วย
ไม่ติดคาดเหลือง แต่ก็ติด tag Advertising ผมนี่จิ้นเลย
Advertising เป็นข่าว/บทความที่เกี่ยวกับโฆษณาครับ แต่ถ้าบทความจ่ายเงินจะเป็น Advertorial ครับ
หลายคนที่ไม่เชื่อว่าไม่ดักฟัง เพราะเจอประสบการณ์กับตัวเอง
อย่างผมเอง คุยกับพี่คนหนึ่งเรื่องอุปกรณ์ชนิดหนึ่ง ซึ่งไม่มีการค้นข้อมูลก่อนคุยและหลังคุย เพราะเป็นอุปกรณ์ที่ใช้อยู่แล้ว ซื้อมาใช้หลายปีล่ะ (เป็นอุปกรณ์ที่ต่อเน็ตไม่ได้ ฮ่า)
แต่หลังจากคุยเสร็จ (คุยแล้วจบกัน จากนั้นคุยเรื่องอื่นต่อ) ผ่านไปไม่กี่วัน โฆษณาตามมาเลย ฮ่า
และยังมีข่าวที่หลุดมาแบบนี้อีก
มันเลยมีความรู้สึกว่า facebook น่าจะต้องทำอะไรมากกว่าที่เขาพยายามบอกเรา (มากกว่าที่เขาแก้ตัว ฮา)
~ HudchewMan's Station & @HudchewMan~
ผมเจอบ่อยๆ ที่พูดคุยกับเพื่อนแล้วโฆษณาก็เด้งขึ้นมา โดยที่ไม่ได้เสิร์จใดๆ มาก่อน เลยปักใจเชื่อว่า fb แน่นอน อีกทั้งมาเจอเคสอันนี้ล่ะ ไม่รู้จะแอบแสกนบลูทูธไปทำไม
https://puu.sh/EyEMh/35ac144f89.png
ผมไม่รู้บลูทูธจะเหมือนกันไหม แต่ไวไฟใช้ระบุตำแหน่งจากชื่อได้ครับ
อาจจะเป็นเพราะการ "สังเกตุเห็น" ด้วยเข่น...
"เวลาเราขับรถรุ่นอะไร เรามักจะเห็นว่าทำไมคนขับรถรุ่นเดียวกับเราเยอะจัง"
+1 คือโฆษณามันก็กวาดไปทั่วๆ นั่นแหละ แต่เราก็สะดุดตาอันที่เราสะกิดใจเป็นพิเศษ
แต่มันก็เป๊ะเยอะจริงๆ นั่นแหละครับ ?
ผมนี่ โฆษณามักจะเป็นตัวเดิม ๆ ทั้งใน fb ทั้งใน youtube เพราะผมค่อนข้างระวังการใช้งานอะไรพวกนี้ และก็ไม่ได้ใช้บ่อยด้วย เลยมันมักจะโฆษณาอันเดิม ๆ ซ้ำอยู่นั้นเป็นเดือน ๆ จนแอบรำคาญก็มี
ทีนี้ พอคุยกับเพื่อนเรื่องอะไรก็ตาม ที่ไม่เคยคุยกับมันมาก่อน และเราก็ไม่ได้สนใจมาก่อน ไม่นานครับ ไอ้ที่ว่ามันปรากฎเลย จากที่ ไม่เคยปรากฎให้เห็น และก็ปรากฎแต่อย่างอื่นที่ไม่ใช่ซ้ำ ๆ ก็ย้ายมาปรากฎใอ้นี้
มันไม่ใช่ครั้งเดียวด้วย ตอนผมเดินทางเข้าไปตามป่า ตามเขา หรือในเมือง หรือต่างประเทศ หรืออะไรก็แล้วแต่ เงื่อนไขผมมันหลากหลาย เพราะทำงานอิสระ และรับงานตามดีล ทำให้งานมักจะมีเงื่อนไขประหลาด ๆ เยอะ ทำให้ผมอาจจะต้องการอะไรบางอย่างเฉพาะการณ์ขึ้นมาดื้อ ๆ แค่คุยกันแป๊บ ๆ โฆษณาก็ออกมาให้เห็นหลายครั้งแล้วครับ
จากบทความ และจากที่คนอื่นพูด ผมให้น้ำหนักเรื่องว่า คนน่าจะตรวจจับกันได้มากกว่า เงื่อนไขอื่น ๆ ที่บทความพูดถึงที่เหลือทั้งหมดอีก (แต่ทำไมตรวจไม่ได้ หรือมันไม่ได้ดักฟังจริง? แต่กรณีผมนี่ บอกตรง ๆ ว่าทำให้เชื่อยากอยู่
เพจตัวอย่างผลงานถ่ายภาพ / วีดีโอ
โดยทั่วไปผมให้ข้อมูลค่อนข้างง่ายนะครับ (เมื่อก่อนหวงมาก เดี๋ยวนี้ค่อนข้างปล่อย) แต่ block 3rd party cookie กับเอะอะใช้ InPrivate เจอโฆษณาแทบไม่เปลี่ยนเหมือนกันครับ T-T
จริง ๆ ผมไม่ได้ห่วงข้อมูลส่วนตัวผมเลย ไม่แม้แต่น้อย เพียงแต่ ผมไม่ใช้มั่ว ไม่กด yes ผ่านแบบลวก ๆ แล้วดูว่าอันไหนไม่จำเป็น เราก็ไม่ต้องให้ไป แต่โดยปกติแล้วไม่ได้หวงข้อมูลส่วนตัว
ประกอบกับใช้น้อยด้วย อย่างหน้าที่ในบทความแสดงให้เห็นหน้าเว็บ fb ส่วนที่รายงานความโปร่งใส หน้านั้น ผมมี item อยู่ 1 - 3 ตัวเองครับ เพราะผมก็ไม่ค่อยไปกดอะไรมั่ว แค่กด like ยังยากเลย จะ like เพราะชอบจริง ๆ เท่านั้น ซึ่งเป็นคนเส้นลึก ชอบอะไรยากถ้ามันไม่ใช่จริง ๆ ข้อมูลมันเลยไม่ค่อยรั่วโดยปริยาย
แต่ พูดไม่กี่คำ ผมเจอโฆษณาในสิ่งที่แทบไม่เคยพูด หรือไม่เคยพูดเลย ไม่เคยใช้ แต่โฆษณามาได้
โมเดลเทพไม่เทพไม่รู้ แต่ผมว่าเทพ และ like ให้เลย เยี่ยมจริง ๆ 555
เพจตัวอย่างผลงานถ่ายภาพ / วีดีโอ
อ้าว อันที่จริงเขาก็แค่แซวกันเล่นขำๆ ว่าดักพังหรือป่าว (เพราะเสนอโฆษณาได้ตรงใจตลอดอ่ะ)
กลายเป็นจริงจัง กันซะถึงขนาดต้องออกมาวิเคราะกันเลยเหรอเนี่ย
ดักฟังมีแน่ แค่ไม่รู้เจ้าไหน เพราะมีคนรู้จักเคยรับงานถอดเสียงคลิปที่ไม่น่าจะเป็นการจงใจพูดให้ฟัง แต่ไม่คิดว่าจะเอาคนมานั่งถอดเสียงกันเพื่อทำโฆษณา แต่อาจเอาไปเทียบกับอัลกอริธึมในการแปลประโยคมากกว่า
ไม่รู้สิแต่ผมว่าดักอะคงอาจมี trigger word บางอย่างฝังอยู่ คือเพิ่งเจอกับตัวเองสดๆ เลยเรื่องมีอยู่ว่า
เพื่อนที่ทำงานเก่าโทรมาฝากงานให้เพื่อนอีกคนนึง สมมุติว่าคนที่ที่จะฝากงานให้ชื่อนาย ก.
ผมก็ถามไปว่านาย ก.คือคนไหนผมจำหน้าไม่ได้ ก็อธิบายกันไปประมาณนึง สุดท้ายผมก็จำไม่ได้หรอก
แต่พอตกเย็นกลับถึงบ้าน facebook ก็ suggest นาย ก. มาให้ผม add เป็นเพื่อนเฉยๆเลย
ทั้งๆที่มีเพื่อนร่วมกันแค่ 2 คนเอง ผมก็เปิดดู profile แล้วส่งรูปไปใน line
กลับไปให้เพื่อนที่โทรมาแล้วถามว่าคนนี้รึป่าว เพื่อนบอกใช่
ส่วนตัวเลยคิดว่าคงมีดักฟังแน่นอน
นาย ก. อาจจะขึ้นแนะนำมาพักนึงแล้วก็ได้นะครับ :p เอาจริงๆ ระบบแนะนำเพื่อนของ Facebook นี่น่ากลัวกว่าโฆษณาเสียอีก เพื่อนที่เปิดบัญชีลับบ่นให้ฟังหลายทีแล้วว่าแยก จำกัดสิทธิ์ ระวังไม่ให้เกี่ยวข้องและไม่แสดงตัวตนแค่ไหนมันก็แนะนำเพื่อนที่ไม่ได้เฉียดเข้าใกล้แต่รู้จักจริงๆ ขึ้นมาอยู่ดี
น่าจะเพิ่งขึ้นครับเพราะมันอยู่ที่หน้า noti ผมเปิดดูบ่อยๆ ไม่เคยเห็น
แต่ตั้งแต่ show ขึ้นมาก็อยู่ที่หน้า suggest ตลอดเลย
อาจมาจาก Call Log, Contact List ก็ได้ครับ
ความเป็นไปได้อีกอย่างหนึ่งคือ นาย ก. อาจจะเคยลองมาเปิดดูหน้าโปรไฟล์ของคุณจากการแนะนำของเพื่อนที่ทำงานเก่าคุณก็เป็นได้ครับ ซึ่งนั่นก็น่าจะเพียงพอที่จะให้น้ำหนักในการเอามา suggest
อันนี้ดูใกล้เคียงครับ เพราะเค้าจะต้องเป็นฝ่ายมาติดต่อผมก่อน ถ้าอยากได้งานใหม่
ต่อให้ Facebook ออกมาบอกว่าไม่ได้ดักฟัง
ในฐานะ Developer ก็คงรู้ว่าเราสามารถทำอะไรได้บ้างกับโค้ดของเราและซอฟท์แวร์ของเรา
ส่วนตัวผมคิดว่ามันมีคนดักฟังโทรศัพท์นะ แต่ไม่รู้ว่าเป็น Facebook หรือ Google ที่ัดักฟังแล้วเอาไปขายต่อ
That is the way things are.
ยังไงผมก็ยังยืนยันว่าดักฟังครับ วันก่อนคุยกับแม่เรี่องฉีดปลวกกับล้างแอร์ facebook ads ขึ้นมาเต็มเลยครับ ทั้งๆ ที่ผมไม่เคยค้นหาหรือสนใจเรี่องเหล่านี้มาก่อนไม่ว่าที่ไหนก็ตาม
เคยคิดว่าดักฟังได้ เพราะอาจจะมีช่องทางพิเศษที่เปิดให้เฉพาะ แบบไม่ให้โดนตรวจจับได้
นี่ก็เปิดสิทธิ์เพียบนะ แล้วเจอแต่โฆษณาพนันที่หว่านแหแบบกว้างๆเลย
ปล. tag list รวนจนดูไม่ได้ไปแล้วใน facebook
Facebook ดักฟังผมว่าไม่น่ามีนะ
ถ้ามี speech-to-text และรันบนเครื่องเรา(โดยเฉพาะภาษาไทย) อย่างแรกเลยแบทมือถือหมดไวเว่อๆ แบบรู้สึกได้แน่ๆ มือถือระดับบนอาจจะไม่มีผลมาก แต่มือถือระดับกลางมีผลแน่ หรือระดับล่างนี่ไม่ต้องใช้เครื่องกันเลยแน่ๆ
และจากที่เจอมา โฆษณาส่วนใหญ่ พ้องกับ Group ที่อยู่ Page ที่ follow หรือสิ่งที่เรา Post/interact/sign-in with facebook ด้วย แต่ก็นานๆ ทีมีแปลกๆ(ไม่เคยพูดถึง ไม่เคย searchที่ไหน) โดดมามั่ง แต่ไม่เยอะ และไม่บ่อย น่าจะคนทำ ads นูบมากกว่า tag กว้างไป (ผมเคยทำ ads facebook มาก่อน รู้ว่ามันเลือก และทำอะไรได้บ้าง)
ผมว่าที่เป็นไปได้ คือ Group ที่อยู่ Page ที่ follow หรือสิ่งที่เรา Post/interact/sign-in with facebook + ซื้อ/แลกเปลี่ยน ข้อมูลกับ google/amazon/ebay/ฯลฯ ยิ่งหลังๆ มี ai น่าจะเอามาวิเคราะห์ post(รูป)ของเราได้ดีขึ้นว่าเกี่ยวกับอะไร เชื่อมโยงอะไรบ้าง โพสข้อความอารมณ์แบบไหน
ส่วนตัว ถ้าข้อมูลพวกนี้ไม่ได้ให้ใคร(คน)ไปดูได้ แต่เป็นระบบคัดกรองและเลือก(คนอาจจะดูได้แค่สถิติเป็นตัวเลขโดยรวม) ผมค่อนข้างชอบนะ จะโฆษณายัดหน้าเราทั้งที ขอเป็นอะไรที่เราสนใจน่ะดีละ ถึงจะไม่สน แต่ก็ดีกว่าส่งอะไรที่เราไม่ชอบมา
ได้ยินว่า NLP ภาษาไทยตอนนี้ยังง่อยมาก ๆ เหตุเพราะใช้เทคนิคเดียวกับภาษาอังกฤษไม่ได้
ดังนั้นเรื่องดักฟัง -> แปล -> ตีความ -> ส่งคีย์เวิร์ดกลับยานแม่นี่ ผมว่าไม่น่าเป็นไปได้ด้วยครับ
อยากให้มีการทดลอง
พูดสิ่งที่ไม่เกี่ยวข้องกับเราเลย ย้ำๆบ่อยๆ ต่อหน้าโทรศัพท์หรือตอนเปิดเฟสบุค
โดยเราไม่เสิร์ชหาหรือหาข้อมูลสิ่งนั้นจากที่ไหนเลย พูดลอยๆอย่างเดียว
ดูซิว่ามันจะขึ้นโฆษณาให้ไหม
ดูเหมือนจะมีคนทดลองแล้วนะครับ
Google มีโอกาสกว่ามาก
*ประสบการณ์ตรง
***ปิด permission microphone facebook ตลอดเพราะระวังเรื่องพวกนี้ตลอดมา
ครั้งแรก นั่งคุยกับเพื่อนเชิงว่า ถ้าซื้อเครื่องทำน้ำแข็ง จะคุ้มกว่าซื้อถุงมั้ย แน่นอนไม่เคยค้นหาทาง internet ไม่ว่าบนช่องทางไหน และผ่านไป 1-2 วัน โฆษณา เครื่องทำน้ำแข็งก็มาบน feed
ล่าสุด บริบทเดียวกัน คุยกับเพื่อนว่า จะซื้อเตาแก๊สกระป๋อง ไปทำอาหารริมทะเลกัน 1-2 วัน มาบน feed เช่นกัน
มันรู้ผ่านทางเพื่อนหรือเปล่าครับ