Tags:
Node Thumbnail

AI สำหรับสร้างรูปภาพจากคำบรรยาย กำลังเป็นหัวข้อวิจัยที่มาแรง ซึ่งเห็นได้จากทั้ง DALL·E ของ OpenAI หรือ Imagen ของกูเกิล ที่สามารถสร้างสรรค์รูปภาพได้หลากหลายแบบ คราวนี้ก็เป็น Meta ที่เปิดตัวเครื่องมือแบบนี้บ้าง

งานวิจัยนี้ของ Meta มีชื่อเรียกว่า Make-A-Scene ใช้อินพุตที่เป็นข้อความบรรยายรายละเอียดรูปภาพ แต่เพิ่มเติมคือสามารถรับอินพุตที่เป็นภาพร่างเบื้องต้นได้ด้วยคู่กัน ซึ่งช่วยแก้ปัญหาการได้ผลลัพธ์รูปภาพไม่ตรงกับที่คิดในหัว

โมเดลของ Make-A-Scene เทรนด้วยข้อมูลรูปภาพหลายล้านรูป และหาความสัมพันธ์ในแบบต่าง ๆ ผลลัพธ์คือภาพที่ความละเอียดสูงสุด 2048x2048 การใช้แบบอินพุตร่างประกอบการสร้างรูปภาพ ช่วยให้เกิดไอเดียใหม่ ๆ ที่สวยงามตามความต้องการผู้ใช้งานมากขึ้น

alt="Make-A-Scene"

ตัวอย่างที่ Meta ยกมาเช่นภาพ ฮอตดอกลอยบนฟ้าแบบหน้าชัดหลังเบลอ ซึ่งหากไม่ใส่ข้อมูลภาพร่างไปด้วย ฮอตดอกก็อาจลอยอยู่ในตำแหน่งที่ไม่ตรงกับที่ผู้ใช้งานอยากได้ ภาพร่างจึงช่วยแก้ปัญหานี้

No Description

ในขั้นถัดไป Meta จะพัฒนาโมเดล Make-A-Scene รองรับการสร้างสรรค์ผลงานหลายแบบทั้ง 2D 3D ไปจนถึงคอนเทนต์แบบ Metaverse ด้วย

ที่มา: Meta ผ่าน Engadget

Get latest news from Blognone

Comments

By: Jericho200 on 16 July 2022 - 14:13 #1255455

Craiyon (ชื่อเดิม DALL·E mini) นี่ไม่ได้เกี่ยวข้องกับ DALL·E หรือ DALL·E 2 ของ OpenAI นะครับ
แต่เป็น Open-source Project ที่สร้างเลียนแบบ DALL·E ของจริง แล้วต่อมาก็เปลี่ยนชื่อเป็น Craiyon เพื่อป้องกันความสับสนนี่แหละครับ

By: arjin
WriteriPhoneWindows
on 16 July 2022 - 14:22 #1255457 Reply to:1255455
arjin's picture

ขอบคุณครับ แก้ไขแล้ว