Google เปิดตัว Imagen งานวิจัยใช้ AI สร้างรูปภาพเสมือนจริงจากข้อความบรรยาย

By: arjin

on 25 May 2022 - 07:20 Tags:

Topics:

Google

Artificial Intelligence

Imagen

กูเกิลเปิดตัว Imagen งานวิจัย AI สร้างรูปภาพเสมือนจริงที่ใช้ input เป็นคำบรรยาย แบบเดียวกับ DALL·E ของ OpenAI โดยมีขั้นตอนการทำงานคือแปลงข้อมูล text ออกมาเป็นภาพความละเอียดต่ำ จากนั้นใช้เครื่องมือแปลงให้เป็นภาพที่มีความละเอียดมากขึ้น

จุดเด่นที่กูเกิลระบุว่า Imagen เหนือกว่าเครื่องมือประเภทเดียวกัน คือการพัฒนาเครื่องมือวัดผลที่ชื่อ DrawBench ซึ่งใช้การเทียบข้อมูล text แบบเดียวกัน สร้างรูปภาพจากเครื่องมือหรือโมเดลอื่นมาเปรียบเทียบได้แก่ VQ-GAN+CLIP, Latent Diffusion Models และ DALL-E 2 ซึ่งประเมินคุณภาพของรูปโดยใช้คนตัดสิน พบว่า Imagen มีคะแนนที่ดีกว่า

อย่างไรก็ตามงานวิจัยและเครื่องมือนี้ กูเกิลบอกว่ายังไม่เหมาะสมที่จะเปิดรายละเอียดทั้งหมดต่อสาธารณะ (เช่นเดียวกับ DALL·E) เนื่องจากชุดข้อมูลรูปภาพตั้งต้นที่ใช้ ต้องประมวลผลและตรวจสอบอีกมาก ว่าไม่มีความลำเอียงของข้อมูล หรือประเด็นที่อ่อนไหว

ที่มา: Imagen ผ่าน The Verge

alt="Imagen Image"

Hiring! บริษัทที่น่าสนใจ

LINE MAN Wongnai

Join our journey to becoming No.1 food platform in Thailand

Data Wow Co.,Ltd

We enable our clients to realize increased productivity by solving their most complex issues by Data

MOLOG Tech

We are Modern Logistic Platform, Specialize in WMS, OMS and TMS.

Comments

By: Whisper

on 25 May 2022 - 09:52 #1249850

ตามเข้าใปดูรูปจาก Imagen แล้วรู้สึกขนลุกไงไม่รู้

สิ่งที่คนเรามั่นใจมาตลอดว่าเหนือกว่าเครื่องจักรคือจินตนาการ
แต่มา ณ ตอนนี้มันสั่นคลอนแล้ว

By: TheOrbital

on 25 May 2022 - 11:23 #1249862 Reply to:1249850

ยังไงผมว่าสำหรับงานศิลปะมันไม่ได้อยู่แค่จินตนาการแต่ขึ้นกับอารมณ์ด้วย
และจินตนาการของ AI ก็ยังมี Pattern อยู่ (แต่จุดนี้อนาคตอาจจะพัฒนาขึ้นก็ได้)

AI พอจะสร้างภาพให้ได้ แต่สำหรับภาพวาด อารมณ์จะทำให้ภาพต่างออกไปในแต่ละครั้งที่วาด
และจินตนาการของมนุษย์ไม่มีแพทเทิร์นที่แน่นอน เช่นถ้าให้วาดรูปตามสั่งเหมือนๆกันวันละรูป
สำหรับมนุษย์อาจจะได้ภาพที่ใกล้เคียงแต่ไม่มีทางเหมือนกันเป๊ะๆแน่
แต่ AI มันอาจจะวนลูปภาพเดิมๆเป๊ะๆกลับมาให้ได้