Alibaba โอเพนซอร์ส Wan2.1 โมเดลปัญญาประดิษฐ์ที่สามารถสร้างวิดีโอได้รุ่นล่าสุด โดยมี 4 โมเดลย่อย ซึ่งถูกพัฒนาบนพื้นฐานของโมเดลสร้างรูปภาพ Tongyi Wanxiang
ทั้ง 4 โมเดลแตกต่างกันที่จำนวนพารามิเตอร์ได้แก่ Wan2.1-T2V-14B, Wan2.1-I2V-14B-720P, Wan2.1-I2V-14B-480P และโมเดลเล็กที่สุด Wan2.1-T2V-1.3B ที่สามารถรันได้บนจีพียูเกรด Consumer เช่น RTX 4090
Wan2.1 รองรับการทำงานในหลายรูปแบบอินพุททั้ง Text-to-Video, Image-to-Video, การตัดต่อวิดีโอ, Text-to-Image ไปจนถึง Video-to-Audio นอกจากนี้ยังสามารถสร้างเอาท์พุทเป็นข้อความ Visual Text รองรับทั้งภาษาจีนและภาษาอังกฤษ
ดาวน์โหลดและดูรายละเอียดได้ที่ HuggingFace หรือ GitHub
ที่มา: South China Morning Post และ Alibaba