Deepmind โชว์ความสามารถของปัญญาประดิษฐ์ video-to-audio (V2A) ที่สามารถเติมเสียงเข้าไปยังวิดีโอได้ตามคำสั่ง เปิดแนวทางการใช้งานที่หลากหลาย ทั้งการเติมเสียงใส่วิดีโอที่สร้างจากปัญญาประดิษฐ์ หรือจะเป็นการเติมเสียงใส่วิดีโอเก่าที่ไม่มีเสียงแล้ว
เนื่องจาก V2A รองรับพรอมพ์จากผู้ใช้ด้วย ทำให้สามารถปรับแต่งโทนของเสียงได้หลากหลายแม้จะเป็นวิดีโอเดียวกัน เช่น ต้องการใส่เพลงประกับซีนนั้นๆ หรือต้องการเพียงเสียงประกอบเฉยๆ
ปัญญาประดิษฐ์สร้างเสียงจากข้อความหรือภาพนั้นมีการนำเสนอมาก่อนหน้านี้แล้ว แต่ความได้เปรียบของ V2A คือมันเข้าใจวิดีโอมากพอที่จะสร้างเสียงที่ลงจังหวะกับวิดีโอพอดีได้ในตัว ฟีเจอร์สำคัญ เช่น การสร้างเสียงจากบทพูดแล้วซิงก์กับใบหน้าของตัวละครในวิดีโอ
Deepmind ยังคงแนวทางจำกัดการใช้งานปัญญาประดิษฐ์เหล่านี้ไว้กับชุมชนครีเอเตอร์ในช่วงแรก เช่นเดียวกับโมเดลอื่นๆ ที่เปิดตัวไปตั้งแต่งาน Google I/O โดยระบุว่าหากแน่ใจว่าปลอดภัยจึงเปิดออกสู่วงกว้าง
ที่มา - Deepmind
Comments
ต่อไปโลกเราจะเหลืออะไรจริงบ้างนะ
เมื่อก่อนมีรูปมี VDO เป็นหลักฐานตอนนี้ทำด้วย AI แบบแยกไม่ออก เลย
"Deepmind ระบุว่าหากแน่ใจว่าปลอดภัยจึงเปิดออกสู่วงกว้าง"
หันไปมอง OpenAI Sam Altman : ใช้ๆไปเหอะ ชาวโลกพวกเรามา Test on Production กัน! :)
นึกถึงเคสวิดีโอเก่าๆ ที่ภาพไม่ชัดเสียงไม่ชัด
ต่อไปน่าจะใช้ A.I. ปรับความละเอียดให้ดีขึ้นได้
@ Virusfowl
I'm not a dev. not yet a user.
ตอนนี้ก็มีแล้วแต่ในความละเอียดต่ำมากๆก็ยังไม่เวิร์คเท่าไหร่ ถ้าพวกแบบคลิป720p upscaleไป4k นี่ค่อนข้างดีใช้ได้เลย
ขอคำแนะนำหน่อยได้มั้ยครับ มีคลิปเก่าๆ 720p อยากลอง Upscale ดู