งาน CCC ที่เยอรมันเป็นงานประชุมวิชาการของแฮกเกอร์ระดับโลกที่มักมีการเปิดเผยเทคนิคใหม่ๆ ในการเจาะระบบมากมาย และปีนี้งานก็เริ่มต้นขึ้นในชื่อ 28C3 (ตัวเลขเพิ่มขึ้นตามจำนวนครั้งของงาน) การบรรยายแรกที่เปิดเผยออกมาคือการวิเคราะห์รูปแบบของแพ็กเก็ตของโทรศัพท์ไอพี (Voice over IP) เช่น Skype และ GTalk ที่มักเข้ารหัสข้อมูลเสียง แต่แฮกเกอร์ก็ยังสามารถ "เดา" ได้ว่ามีการพูดประโยคบางประโยคหรือไม่ด้วยความแม่นยำสูง
รูปแบบการวิเคราะห์นี้อาศัยความจริงที่ว่าตัวเข้ารหัสสัญญาณเสียงนั้นมักมีความสามารถในการบีบอัดค่อนข้างสูง แต่สัญญาณเสียงจำเป็นต้องส่งไปหลังจากผ่านการเก็บข้อมูลไปได้ระยะเวลาหนึ่ง เมื่อหาความสัมพันธ์ของจำนวนแพ็กเก็ต-ขนาดแพ็กเก็ตได้ แล้วค้นหารูปแบบเดียวกันในข้อมูลโทรศัพท์ ตัววิเคราะห์ก็จะสามารถเดาได้ว่าคู่สนทนาที่กำลังดักฟัง (แต่ฟังเนื้อหาภายในไม่ได้) กำลังพูดประโยคที่ต้องการค้นหาอยู่หรือไม่
การเทียบรูปแบบประโยคใช้การเทียบแบบ Dynamic Time Warping (DTW) ที่ใช้หารูปแบบที่อาจจะเร็วช้าต่างกันไป มีการฝึกด้วยการพูดประโยคเดิมๆ ด้วย codec แบบหนึ่งๆ ซ้ำๆ กันเพื่อหารูปแบบของ DTW จากนั้นจึงนำไปจับข้อมูลจริง พบว่าให้ความแม่นยำสูงกว่า 60%
รูปแบบการใช้งานแบบนี้ จึงเป็นไปได้ที่หน่วยงานเช่น บริษัท หรือรัฐบาล จะสามารถติดตั้งเครื่องวิเคราะห์แล้ว "เดา" ว่าคู่สายใดกำลังพูดคำสำคัญที่ต้องการจับตาอยู่โดยไม่ต้องถอดรหัสแต่อย่างใด
ที่มา - 28C3
Comments
บรรทัดที่ 4 : สามารถ "เดา" ได้ว่า
บรรทัดที่ 12 : หน่วยงานเช่น บริษัท หรือ รัฐบาล ผมไม่รู้ว่ามันต้องเว้นวรรคยังไงแต่มันติดกันยาวเลยครับ
ขอบคุณครับ
อาศัยฐานข้อมมูลที่หนาหน่อย แต่ว่าสามารถ "ดักมาเทียบ" ได้หมดเลยนะนั่น
Dynamic Time Wrapping เป็นเทคนิคของคนที่ทำ Speech Recognition ในยุคแรก ๆ แต่ภายหลังก็ลดความนิยมไป เพราะมีการใช้ Neural Network แทน ไม่คิดเลยว่ามันจะถูกนำกลับมาใช้ประโยชน์แบบนี้ได้ด้วย
ต่อไปเราก็ดักจับโดยใช้ Neural Network แทน :p
คนที่คุณก็รู้ว่าใคร~