การใช้ปัญญาประดิษฐ์ "สร้าง" ภาพความละเอียดสูงจากภาพความละเอียดต่ำเช่นแบบที่ถูกเบลอแบบโมเสค เคยมีการนำเสนอมาแล้วก่อนหน้านี้ แต่ตอนนี้โครงการ Google Brain ก็นำเสนอสถาปัตยกรรม สำหรับการสร้างภาพความละเอียดสูงจากภาพที่เบลอมาแล้ว
สถาปัตยกรรมของกูเกิลรับภาพขนาด 8x8 พิกเซล แล้วสร้างภาพขนาด 32x32 พิกเซล โดยสร้างภาพจากข้อมูลที่ได้จากภาพขนาดเล็กและยังคงดู "สมเหตุสมผล" สำหรับมนุษย์
สถาปัตยกรรมของกูเกิลประกอบไปด้วยเครือข่ายนิวรอนสองฝั่ง คือฝั่ง conditioning network สำหรับการรับภาพความละเอียดต่ำ และ prior network สำหรับการพยากรณ์ภาพความละเอียดสูง จากน้้นนำภาพทั้งสองฝั่งมารวมกันด้วยการบวกพิกเซลเข้าด้วยกันแล้วผ่านฟังก์ชั่น softmax ในขั้นสุดท้าย
กูเกิลทดสอบขั้นสุดท้ายด้วยการให้มนุษย์ทดลองเลือกภาพระหว่างภาพ 32x32 พิกเซลของจริงและภาพที่สร้างขึ้นมา การสร้างภาพใบหน้ามนุษย์ยังหลอกผู้ทดลองสำเร็จเพียง 10.% ขณะที่ภาพห้องนอนจากชุดข้อมูล LSUN สามารถหลอกมนุษย์ได้ถึง 27.9% โดยความสำเร็จในการหลอกมนุษย์ได้สมบูรณ์จะอยู่ที่ 50% (งงสนิทว่าภาพไหนภาพจริง)
ที่มา - Arxiv
Comments
กำลังคิดแบบที่ชั้นคิดใช่มั๊ย B1?
เห็นอยู่ว่าภาพมันเพี้ยนหน่ะ วันดีคืนดีอาจจะเจอของแปลกนะครับ
แก้เบลอภาพผู้ต้องสงสัยในข่าวใช่ไหมครับ ^^
ฉันกำลังคิดอยู่ล่ะ B2 ( ͡° ͜ʖ ͡°)
สำหรับการนำไปใช้เพื่อแก้เบลอภาพ "อื่นๆ" มันต้องมีฐานข้อมูลภาพจำนวนมากเสียก่อนนะครับ จะเอาโมเดลอย่างอื่นไปแก้เบลอเฉยๆ ไม่ได้
(หรือมันมีคนทำฐานข้อมูลแล้ว?)
lewcpe.com, @wasonliw
ฐานข้อมูลอย่าได้กังวลเพราะมันมีอันเซนเป็นฐานข้อมูลเพียบเลย XD
เราก็คิดเหมือนนาย B2
ปล.คิดถึงนะเตง
พูดถึง ผมว่ามันก็ไม่ค่อยเหมือนนะ แต่โครงเหมือน แต่แค่นี้ก็ฉลาดโคตรแล้วครับ
ยังไม่ดีเท่าไหร่ครับ (อย่างที่บอกในย่อหน้าสุดท้าย) แต่ก็มาไกลพอสมควร
lewcpe.com, @wasonliw
บ้าไปแล้ว มนุษย์ก็มองไม่ออกหรอกว่าภาพ 8X8 มันมาจากภาพจริงภาพไหน AI จะฉลาดไปไหน สร้างภาพใหม่ได้ขนาดนั้น
เทคโนโลยีไม่ผิด คนใช้มันในทางที่ผิดนั่นแหละที่ผิด!?!
จินตนาการสำคัญกว่าความรู้ ถ้าเห็นของจริงอาจจะ...
oxygen2.me, panithi's blog
Device: ThinkPad T480s, iPad Pro, iPhone 11 Pro Max, Pixel 6
เหมือนจะทำได้นานแล้วใช่ไหมครับ รู้สึกว่าเคยมีข่าวนี้มานานมากๆ แล้ว
อันนั้น Simulated+Unsupervised ครับ คนละอันกัน อันของ Apple CNN จะเป็นลักษณะที่เป็น Residual Network(ResNet) แล้ว Layer เป็นแบบง่ายๆคือ Conv -> ReLu -> Conv -> ResNet -> ReLu -> Output
ให้มนุษย์หรอกคอมพิวเตอร์บ้างครับ ยังไงผลลัพธ์มันไม่แน่นอน
เหมาะเอาไปใช้กับหนังเอวีญี่ปุ่น
ดาราสวยๆเล่นแบบ censored หมด ดูแล้วขัดใจ
มันมีหมวด uncen ด้วยหนิพี่
โดนสร้างภาพ ?
ถ้ามันพัฒนาไปถึง 50% แล้วเอาไปใช้จับผู้ร้ายจากกล้องวงจรปิดแล้วมีปัญหาแน่ๆ
เพราะถึงมันเหมือนคนก็จริง แต่ไม่เหมือนกับคนที่เป็นแบบ (คนที่ทำผิด) กลายเป็นว่าไปเหมือนกับอีกคนแทน (ที่ไม่ได้ทำผิด) ซวยแน่ๆคนนั้น
มันก็เหมือนเอาภาพไปให้คนทำกราฟิกแก้ไขภาพเพื่อให้มันชัดขึ้นล่ะครับ มันมีทางใช้งานอื่นแต่ถ้าใครคิดจะเอาไปจับคนร้ายคงต้องด่าว่าไม่รู้เรื่อง
lewcpe.com, @wasonliw