กูเกิลรายงานถึงการใช้เครือข่ายประสาทเทียม (neural network) ที่เรียกว่า Residual Gated Recurrent Unit (residual GRU) เพื่อการบีบอัดภาพแบบสูญเสียรายละเอียด โดยยังคงรายละเอียดเทียบเคียงกับการบีบอัดภาพแบบดั้งเดิมอยู่
การสร้างเครือข่ายประสาทเทียมอาศัยภาพจำนวนมากเพื่อฝึกการบีบอัด โดยใช้ภาพขนาด 720p จำนวน 6 ล้านภาพ ซอยภาพออกเป็นบล็อก 32x32 พิกเซล เพื่อฝึกตัวเข้ารหัสภาพ (encoder) และตัวถอดรหัสภาพ (decoder) กระบวนการบีบอัดภาพจะบีบอัดเป็นรอบๆ แล้วดูว่ามีความผิดพลาดจากภาพต้นฉบับอย่างไรบ้าง จึงนำความผิดพลาดเหล่านั้นมาใส่เป็นอินพุตเพื่อเพิ่มข้อมูลให้ภาพคุณภาพดีขึ้น
ทีมงานทดสอบคุณภาพของภาพผลลัพธ์ที่ได้ เทียบความต่างภาพด้วยกระบวนการ MS-SSIM โดยกำหนดคุณภาพที่ยอมรับได้ไว้ที่ 0.9 (1.0 คือมองไม่เห็นความต่าง) สามารถบีบอัดภาพขนาด 1.4MB ให้เหลือ 24KB ได้ เทียบกับ JPEG ที่บีบได้เหลือ 33KB
อย่างไรก็ดี ทีมงานระบุว่าการบีบอัดแบบ JPEG ยังทำงานได้ดีอยู่ แต่ในอนาคตกำลังพัฒนาเครือข่ายประสาทเทียมที่บีบอัดภาพได้เร็วขึ้นและได้ภาพคุณภาพสูงกว่านี้
ที่มา - Google Research
Comments
ผมว่ารายละเอียดหายไปเยอะอยู่นะ แย่กว่า JPEG แบบรู้สึกได้
ผมว่า jpeg ห่วยกว่านะครับ สีเป็นปื้นเลย
เข้าไปดูในลิ้งค์ต้นฉบับ ตรงจมูกหมา jpeg ทุเรศมาก พิกเซลมาเป็นบล็อคๆ แต่ตรงรายละเอียดหญ้าทำได้ดีกว่า Residual GRU คะแนนเฉลี่ยเลยออกมาเท่าๆกันละมั้ง
เข้าใจว่า ระบบต้องใช้พลังในการประมวลทั้งเข้าและถอดรหัสมากขึ้นเมื่อเทียบกับ jpeg
แต่ถ้าประมวลแบบกระจายน่าจะเหมาะสมและคุ้มค่าเพราะพื้นที่จัดเก็บลดลงตั้ง 1/4
1.เราสามารถเอารูปแบบการเข้ารหัสต่างมาให้ AI ฝึก เพื่อสร้างวิธีการเข้ารหัสที่มีประสิทธิภาพมากขึ้นได้หรือไม่ครับ หรือ
2.เราสามารถให้ AI รู้จักช่องโหว่ต่างๆ แล้วเอามาใช้ทดสอบระบบความปลอดภัยเป็นไปได้ไหมครับ
ได้ครับ และเชื่อว่าตอนนี้มีหลายๆบริษัททำให้มันดีอยู่ อย่างน้อยๆก็กูเกิล
ไม่รู้ว่าเข้าใจตรงกันไหมนะครับ ถ้าหมายถึงให้พยายาม extract รูปแบบของแต่ละอัลกอริธึมที่ใช้ในการเข้ารหัสเพื่อนำมาใช้ในลักษณะเดียวกับที่นำข้อมูลดิบมาเป็น dataset ในการเทรนให้ AI เท่าที่ตามหามาผมยังไม่เคยเห็นมีผลงานในลักษณะนี้ออกมาให้ศึกษาเลย(ใครทราบช่วยชี้แนะทีครับ) มันซับซ้อนเกินไปผมว่า AI ที่แพร่หลายกันในปัจจุบันยังทำได้แค่เพียงเอาข้อมูลดิบมาประมวลผลเท่านั้นเอง ยังไม่สามารถประมวลผลในระดับที่เอารูปแบบอัลกอริธึมที่ซับซ้อนมาเป็นอินพุตได้
อืม...ดูแล้วคงต้องพัฒนาส่วน Brightness อีกหน่อยนะครับ ส่วนสีภาพทำได้ดีทีเดียว - -)b
บล็อกส่วนตัวที่อัพเดตตามอารมณ์และความขยัน :P
ตรงที่ดีเทลละเอียดๆนี่เกลี่ยนจนเนียนเลย (หญ้าข้างหลัง กับ จุดสีน้ำตาลเหนือตา)
แต่สังเกตนิดหนึ่งคือ output ที่นำมาคำนวณ % ความแตกต่างมันเล็กมากจนอาจจะทำให้เทียบ % ออกมาแล้วดูเหมือนเยอะ
ไม่แน่ใจว่าถ้าใช้ภาพ resolution ใหญ่มากๆอย่างไฟล์รูป 20-30 MP ของกล้อง DSLR แล้ว output เหลือสัก 1-2 MB นี่จะได้ความต่างที่ 25% เหมือนเดิมไหม