กูเกิลอัพเดตโมเดลปัญญาประดิษฐ์สร้างภาพ Imagen 2.0 โดยเพิ่มฟีเจอร์สำคัญคือการสร้างภาพเคลื่อนไหว และการแก้ไขภาพที่มีอยู่เดิม
การสร้างภาพเคลื่อนไหว เรียกว่า text-to-live image ยังจำกัดที่ความละเอียด 360x640 ยาว 4 วินาที ที่ 24 เฟรมต่อวินาที
สำหรับการแก้ไขภาพ รองรับทั้ง inpainting แก้ไขภายในภาพ และ outpainting เติมภาพเพื่อขยายขนาด รองรับการเพิ่มหรือลดวัตถุในภาพ
ภาพทั้งหมดที่สร้างโดย Imagen จะถูกฝังข้อมูล SynthID เพื่อระบุว่าภาพถูกสร้างโดยปัญญาประดิษฐ์ของกูเกิล
ที่มา - Google Cloud Blog
Comments
Pixel 8 Magic Editor จะได้ใช้บ้างมั้ยนะ ตัวที่มีอยู่ลองแล้วกด save มาใช้ไม่ลงสักที orz
ตัวแต่งภาพนี่โอเค เห็นเริ่มมีใช้ในพิกเซล แต่ไอ้ตัว text to image หรือจะเป็นภาพเคลื่อนไหวก็ตามเถอะ มันถูกเอาไปใช้กับอะไรบ้างรึยัง หรือผมตามข่าวไหนไม่ทันรึเปล่า
หาใช้จริงได้ยากมากฮะ ถ่ายทั่วไปพื้นหลังมันไม่ได้ generate ออกมาได้เนียนแบบบนหาดทรายโล่งๆ ที่เค้าโชว์อะไรแบบนั้นเท่าไหร่ พอมีอะไรที่ต้องสร้างหน่อยก็ดูแย่ไปเลย 😂
มีอันนึงออกมาใกล้เคียงมากคือย้ายคนแล้วข้างหลังมีรั้ว นอกจากระยะห่างที่ไม่ตรงกับช่วงอื่น (ระยะที่ gen ออกมาเท่ากัน แต่ไม่ต่อเนื่องกับของเดิม) ก็คือรั้วดูดีมาก แต่ข้างหลังรัวมันก็ไม่ได้โล่งแล้วที่ gen ออกมาก็คือเศร้า 🥲 รูป selfie ที่ขยับคนไปไว้ตรงกลางหน่อยก็ไหล่/แขนแปลกมาก จับคนมาชิดซ้อนกันนี่เลิกคุยได้เลย 😭 ถ่าย selfie รูปคู่มาอยากจะจับให้ชิดๆ เพื่อเอาไปทำ lock screen (เพราะอัตราส่วนแคบมากๆ ถ่ายปกติเอาขึ้นคือหน้าแหว่งทั้งคู่) ก็คือหมดหวัง