Meta เปิดตัว SeamlessM4T โมเดล AI แบบ multilingual multimodal สำหรับการแปลภาษาทั้งเสียงพูดและข้อความ รองรับเกือบ 100 ภาษา ภายใต้สัญญาอนุญาต CC BY-NC 4.0 สามารถนำไปใช้งานได้สำหรับการวิจัย
ความสามารถของ SeamlessM4T สามารถรับรู้เสียงได้เกือบ 100 ภาษา, แปลภาษาจากเสียงพูดเป็นตัวหนังสือ ได้เกือบ 100 ภาษา, แปลเสียงพูดเป็นเสียงพูด ด้วยอินพุทเกือบ 100 ภาษา และเอาท์พุท 36 ภาษา และแปลจากตัวหนังสือเป็นตัวหนังสือได้เกือบ 100 ภาษา
Meta บอกว่าจุดเด่นของโมเดลแปลภาษา SeamlessM4T นี้ คือการทำงานจบในชุดระบบเดียวทั้งเสียงพูดและข้อความ ไม่ต้องแยกส่วนออกไปในแต่ละระบบขั้นตอนของการแปล พัฒนาขึ้นจากโมเดลแปลภาษาที่ Meta เคยเปิดตัว NLLB เมื่อปีที่แล้ว
ที่มา: Meta