Amazon ยังเดินหน้าเปิดตัวโมเดลตระกูล Nova อย่างต่อเนื่อง ถัดจาก Nova Reel โมเดลสร้างวิดีโอ ตามมาด้วย Nova Sonic โมเดลสร้างคำตอบเสียง ที่เป็นโมเดลตัวเดียวทำงานทั้งการเข้าใจเสียงพูด (speech understanding) และสร้างเสียงพูด (speech generation) ไม่ต้องแยกสองโมเดลทำงานอีกต่อไป
ความน่าสนใจของ Nova Sonic คือเป็นโมเดลแบบเสียง-เสียง (speech-to-speech) รับอินพุตเป็นเสียงพูด แล้วสร้างเอาต์พุตเป็นข้อความหรือเป็นเสียงก็ได้ สามารถทำงานแบบเรียลไทม์
ตัวอย่างการใช้งานที่ Amazon นำมาโชว์คือการใช้เป็นคอลล์เซ็นเตอร์ รับสายจากลูกค้า ฟังเสียงของลูกค้า แปลความหมาย สืบค้นข้อมูลในคลังข้อมูล (ผ่านการเชื่อมต่อระบบภายนอก เช่น RAG) แล้วตอบกลับเป็นเสียงพูดไปยังลูกค้าได้ทันที
ตอนนี้ Amazon Nova Sonic เปิดให้ใช้งานแล้วในภาษาอังกฤษบน Amazon Bedrock
ที่มา - Amazon