Tags:
Node Thumbnail

กูเกิลรายงานถึงการใช้เครือข่ายประสาทเทียม (neural network) ที่เรียกว่า Residual Gated Recurrent Unit (residual GRU) เพื่อการบีบอัดภาพแบบสูญเสียรายละเอียด โดยยังคงรายละเอียดเทียบเคียงกับการบีบอัดภาพแบบดั้งเดิมอยู่

การสร้างเครือข่ายประสาทเทียมอาศัยภาพจำนวนมากเพื่อฝึกการบีบอัด โดยใช้ภาพขนาด 720p จำนวน 6 ล้านภาพ ซอยภาพออกเป็นบล็อก 32x32 พิกเซล เพื่อฝึกตัวเข้ารหัสภาพ (encoder) และตัวถอดรหัสภาพ (decoder) กระบวนการบีบอัดภาพจะบีบอัดเป็นรอบๆ แล้วดูว่ามีความผิดพลาดจากภาพต้นฉบับอย่างไรบ้าง จึงนำความผิดพลาดเหล่านั้นมาใส่เป็นอินพุตเพื่อเพิ่มข้อมูลให้ภาพคุณภาพดีขึ้น

ทีมงานทดสอบคุณภาพของภาพผลลัพธ์ที่ได้ เทียบความต่างภาพด้วยกระบวนการ MS-SSIM โดยกำหนดคุณภาพที่ยอมรับได้ไว้ที่ 0.9 (1.0 คือมองไม่เห็นความต่าง) สามารถบีบอัดภาพขนาด 1.4MB ให้เหลือ 24KB ได้ เทียบกับ JPEG ที่บีบได้เหลือ 33KB

อย่างไรก็ดี ทีมงานระบุว่าการบีบอัดแบบ JPEG ยังทำงานได้ดีอยู่ แต่ในอนาคตกำลังพัฒนาเครือข่ายประสาทเทียมที่บีบอัดภาพได้เร็วขึ้นและได้ภาพคุณภาพสูงกว่านี้

ที่มา - Google Research

alt="upic.me"

Get latest news from Blognone

Comments

By: zerost
AndroidWindows
on 1 October 2016 - 14:57 #943761
zerost's picture

ผมว่ารายละเอียดหายไปเยอะอยู่นะ แย่กว่า JPEG แบบรู้สึกได้

By: Lightwave
iPhoneAndroidWindows
on 1 October 2016 - 15:07 #943762 Reply to:943761

ผมว่า jpeg ห่วยกว่านะครับ สีเป็นปื้นเลย

By: zyzzyva
Blackberry
on 1 October 2016 - 15:16 #943763 Reply to:943761

เข้าไปดูในลิ้งค์ต้นฉบับ ตรงจมูกหมา jpeg ทุเรศมาก พิกเซลมาเป็นบล็อคๆ แต่ตรงรายละเอียดหญ้าทำได้ดีกว่า Residual GRU คะแนนเฉลี่ยเลยออกมาเท่าๆกันละมั้ง

By: syootakarn
iPhoneWindows PhoneAndroidBlackberry
on 1 October 2016 - 15:19 #943765
syootakarn's picture

เข้าใจว่า ระบบต้องใช้พลังในการประมวลทั้งเข้าและถอดรหัสมากขึ้นเมื่อเทียบกับ jpeg
แต่ถ้าประมวลแบบกระจายน่าจะเหมาะสมและคุ้มค่าเพราะพื้นที่จัดเก็บลดลงตั้ง 1/4

By: gettary
ContributorAndroidUbuntuWindows
on 1 October 2016 - 16:12 #943771
gettary's picture

1.เราสามารถเอารูปแบบการเข้ารหัสต่างมาให้ AI ฝึก เพื่อสร้างวิธีการเข้ารหัสที่มีประสิทธิภาพมากขึ้นได้หรือไม่ครับ หรือ

2.เราสามารถให้ AI รู้จักช่องโหว่ต่างๆ แล้วเอามาใช้ทดสอบระบบความปลอดภัยเป็นไปได้ไหมครับ

By: MrThursday
ContributorRed HatUbuntuWindows
on 1 October 2016 - 21:06 #943807 Reply to:943771

ได้ครับ และเชื่อว่าตอนนี้มีหลายๆบริษัททำให้มันดีอยู่ อย่างน้อยๆก็กูเกิล

By: grit
iPhoneWindows PhoneWindows
on 2 October 2016 - 02:24 #943845 Reply to:943771

ไม่รู้ว่าเข้าใจตรงกันไหมนะครับ ถ้าหมายถึงให้พยายาม extract รูปแบบของแต่ละอัลกอริธึมที่ใช้ในการเข้ารหัสเพื่อนำมาใช้ในลักษณะเดียวกับที่นำข้อมูลดิบมาเป็น dataset ในการเทรนให้ AI เท่าที่ตามหามาผมยังไม่เคยเห็นมีผลงานในลักษณะนี้ออกมาให้ศึกษาเลย(ใครทราบช่วยชี้แนะทีครับ) มันซับซ้อนเกินไปผมว่า AI ที่แพร่หลายกันในปัจจุบันยังทำได้แค่เพียงเอาข้อมูลดิบมาประมวลผลเท่านั้นเอง ยังไม่สามารถประมวลผลในระดับที่เอารูปแบบอัลกอริธึมที่ซับซ้อนมาเป็นอินพุตได้

By: itpcc
ContributoriPhoneRed HatUbuntu
on 1 October 2016 - 16:38 #943773
itpcc's picture

อืม...ดูแล้วคงต้องพัฒนาส่วน Brightness อีกหน่อยนะครับ ส่วนสีภาพทำได้ดีทีเดียว - -)b


บล็อกส่วนตัวที่อัพเดตตามอารมณ์และความขยัน :P

By: Go-Kung
iPhoneWindows PhoneAndroidBlackberry
on 3 October 2016 - 09:09 #943942

ตรงที่ดีเทลละเอียดๆนี่เกลี่ยนจนเนียนเลย (หญ้าข้างหลัง กับ จุดสีน้ำตาลเหนือตา)

แต่สังเกตนิดหนึ่งคือ output ที่นำมาคำนวณ % ความแตกต่างมันเล็กมากจนอาจจะทำให้เทียบ % ออกมาแล้วดูเหมือนเยอะ
ไม่แน่ใจว่าถ้าใช้ภาพ resolution ใหญ่มากๆอย่างไฟล์รูป 20-30 MP ของกล้อง DSLR แล้ว output เหลือสัก 1-2 MB นี่จะได้ความต่างที่ 25% เหมือนเดิมไหม