Amazon เปิดตัว Nova Sonic โมเดล speech-to-speech ฟังเสียงพูด แล้วตอบเป็นเสียง

By: mk

on 9 April 2025 - 12:12 Tags:

Topics:

Amazon ยังเดินหน้าเปิดตัวโมเดลตระกูล Nova อย่างต่อเนื่อง ถัดจาก Nova Reel โมเดลสร้างวิดีโอ ตามมาด้วย Nova Sonic โมเดลสร้างคำตอบเสียง ที่เป็นโมเดลตัวเดียวทำงานทั้งการเข้าใจเสียงพูด (speech understanding) และสร้างเสียงพูด (speech generation) ไม่ต้องแยกสองโมเดลทำงานอีกต่อไป

ความน่าสนใจของ Nova Sonic คือเป็นโมเดลแบบเสียง-เสียง (speech-to-speech) รับอินพุตเป็นเสียงพูด แล้วสร้างเอาต์พุตเป็นข้อความหรือเป็นเสียงก็ได้ สามารถทำงานแบบเรียลไทม์

ตัวอย่างการใช้งานที่ Amazon นำมาโชว์คือการใช้เป็นคอลล์เซ็นเตอร์ รับสายจากลูกค้า ฟังเสียงของลูกค้า แปลความหมาย สืบค้นข้อมูลในคลังข้อมูล (ผ่านการเชื่อมต่อระบบภายนอก เช่น RAG) แล้วตอบกลับเป็นเสียงพูดไปยังลูกค้าได้ทันที

ตอนนี้ Amazon Nova Sonic เปิดให้ใช้งานแล้วในภาษาอังกฤษบน Amazon Bedrock

ที่มา - Amazon