เราเคยเห็นโมเดลการสร้างวิดีโอปลอม หรือคลิปเสียงปลอม ที่พัฒนาจากการเทรนข้อมูลคลิปวิดีโอและคลิปเสียงจำนวนมาก หรือ Deepfake แต่งานวิจัยล่าสุดที่เผยแพร่โดย Samsung AI Center สามารถพัฒนาผลลัพธ์ได้ไกลกว่านั้น โดยอาจใช้ข้อมูลเริ่มต้นด้วยรูปภาพเพียง 1 รูปเท่านั้น
รูปแบบการสร้างคลิปดังกล่าว อาศัยการเทรนข้อมูลคลิปวิดีโออื่นที่เป็นการถ่ายเจาะเฉพาะใบหน้าจำนวนหนึ่งก่อน จากนั้นจับเฉพาะตำแหน่งสำคัญบนใบหน้าเพื่อใช้ในการสร้างคลิปวิดีโอ เช่น คิ้ว ตา จมูก ปาก เมื่อเราให้ข้อมูลภาพถ่ายใบหน้า ก็สามารถสร้างวิดีโอปลอมขึ้นมา โดยอาศัยการจับตำแหน่งสำคัญเหล่านั้น แล้วทำการขยับส่วนต่าง ๆ บนใบหน้าออกมานั่นเอง
ในคลิปวิดีโอตัวอย่าง สาธิตการนำภาพนิ่งที่มีชื่อเสียง มาสร้างเป็นวิดีโอสั้นที่มีขยับใบหน้าได้ อาทิ มาริลิน มอนโร, อัลเบิร์ต ไอน์สไตน์ ไปจนถึงภาพวาดโมนาลิซา
ที่มา: TechCrunch
Comments
เห็นภาพดังๆขยับได้นี่ หลอนเลยอะ
น่ากลัวจังสามารถทำให้เราพูดอะไรก็ได้ ถ้าเอาเราไปด่านักการเมืองนี่ กว่าจะตรวจสอบได้ก็คงโดนปรับทัศนคติกับเป็นขี้ปากชาวเน็ตไปละ
เทคโนโลยีช่างน่ากลัวจริงๆ
อันนี้น่าสนใจ เอามาทำ VDO Call แบบไม่ต้องส่งข้อมูล VDO ไป ส่งแต่โครงหน้า กับข้อมูลเสียงไป แล้วไปจำลองอีกฝั่งนึง ลด Bandwidth ได้บาน แถมทำให้ประชุมพร้อมกันได้เยอะขึ้น หรือเอาไปใช้ทำ VR สำหรับกลุ่มธุรกิจพวก Holo len เอานี้ไปใช้น่าจะทุ่นแรงทำ 3D ในอีกฝั่งได้เยอะเลย ทำดีๆ เนี่ยเหมือนภาพในหนังที่มี Virtual AI ออกมาประกาศยึดโลกหลอนเข้ามาเลยทีเดียว
ลด Bandwidth แต่ต้องไปเพิ่มพลัง compute ฝั่งปลายทาง
เป็นคอมเม้นต์ที่สร้างสรรค์ดีครับ นานๆจะเจอคอมเม้นต์เชิงสร้างสรรในการนำนวัตกรรมไปต่อยอดทีนึง
พออ่านเม้นนี่ ผมนึกถึงอีกอย่างนึงเลยครับ cortana ของ ms พอเราคุยกับ cortana ปุ๊บ เปิดเป็นหน้าคนขึ้นมาคุยกับเราได้เลย ซึ่งภาพคนที่มาคุยกับเราคือภาพใครก็ได้ที่เราใส่รูปลงไป (ไม่ใช่ที่ ms ใส่ default มาให้)
ที่แรกเลยที่เราจะเห็นการนำเทคโนโลยีนี้มาใช้คือ PornHub
โหดมาก ประมวลผลเพิ่มอีกนิด ตัด Background ออกก่อน แล้วเอาภาพขยับได้ไปวางบน Background ดั้งเดิมนิ่ง ๆ จะเนียนกว่านี้เยอะเลย
เทคโนโลยีไม่ผิด คนใช้มันในทางที่ผิดนั่นแหละที่ผิด!?!
เจ๋งดี นึกถึงหนังสือพิมพ์แฮรี่พอตเตอร์เลย
เล่นกับ AR น่าสนุก :D
เหมือนชุบชีวิตบุคคลสำคัญในอดีตให้กลับมามีชีวิตอีกครั้ง