Baidu เสิร์ชเอนจินรายใหญ่จากจีนได้เปิดตัว SwiftScribe เว็บแอพที่ใช้ในการถอดความเสียงที่อัดโดยใช้ AI ช่วยในการถอดความ
เทคโนโลยีหลักของ SwiftScribe นั้นคือ Deep Speech 2 ซึ่งเป็นเอนจินด้านการจำแนกเสียง โดยเป็น neural network ที่ถูกเทรนโดยใช้ข้อมูลเสียงนับพันชั่วโมง
วิธีใช้ SwiftScribe เพียงแค่ผู้ใช้อัพโหลดไฟล์เสียงในรูปแบบไฟล์ wav หรือ mp3 ระบบก็จะประมวลผลให้โดยอัตโนมัติ ซึ่งระบบของ Baidu รองรับไฟล์ได้ถึง 1 ชั่วโมง และใช้เวลาเพียง 20 นาทีในการถอดความ แต่การถอดความก็ยังไม่ค่อยสมบูรณ์นัก ผู้ใช้ยังจำเป็นต้องใส่เครื่องหมายวรรคตอน, เปลี่ยนตัวอักษรตัวเล็ก/ใหญ่ และต้องแก้บางคำที่ซับซ้อนด้วย
SwiftScribe ของ Baidu เป็นบริการเปิดให้ใช้งานฟรี แต่ Wu บอกในอนาคตหวังว่าจะเปลี่ยนเป็นธุรกิจ ส่วนฟีเจอร์อื่น ๆ เช่น การรองรับไฟล์หลากหลายฟอร์แมต, เพิ่มเครื่องหมายวรรคตอน จะตามมาในอนาคต
ที่มา - Baidu Research, VentureBeat
Comments
หัวข่าว ถอดความเสียง?
ถ้าคิดว่าคำนี้ไม่เหมาะสม ควรจะใช้คำอะไรหรือครับ? ถอดเสียง หรือถอดความ หรืออย่างอื่นครับ
อ้าว ผมนึกว่าตกคำว่า ถอด "ข้อ" ความ ครับ ไม่นึกว่าตั้งใจใช้คำนี้ ถ้าตั้งใจใช้คำนี้ผมว่าก็โอเคนะครับ
ตอนแรกรู้สึกว่ามันแปลกๆ เพราะ ถอด + ความเสียง ซึ่งปกติแล้ว ความ + คุณศัพท์,กริยา,วิเศษณ์ เช่น ความใหญ่ ความขาว ความบึ้ม อะไรแบบนี้ครับ พอเจอ ความ + คำนาม มันเลยรู้สึกพิกล
แต่พออธิบายว่าเป็น ถอดความ + เสียง แล้วก็โอเคครับ
ถ้าให้แนะนำลดความกำกวมก็ "ถอดข้อความเสียง" ครับ
น่าสน มีรองรับภาษาอะไรแล้วบ้างครับนี่