Tags:
Node Thumbnail

MyShell ผู้ให้บริการปัญญาประดิษฐ์สร้างตัวตนออนไลน์ ปล่อยโมเดล OpenVoice สำหรับการเลียนแบบเสียงพูดโดยอาศัยตัวอย่างเสียงไม่มากนัก

โมเดลปัญญาประดิษฐ์เลียนเสียงพูดมีงานวิจัยออกมาเรื่อยๆ จำนวนมาก OpenVoice ชูจุดเด่นว่าสามารถควบคุมน้ำเสียง, จังหวะพูด ได้ละเอียดกว่า ทำให้มีความเป็นไปได้ที่จะสร้างเสียงที่สมจริงขึ้น

โมเดลแยกออกเป็นสองส่วน คือการแปลงข้อความเป็นเสียงพูด จากนั้นค่อยแปลงเสียงที่ได้ให้น้ำเสียงเหมือนกันเสียงพูดของบุคคลเป้าหมายอีกที เรียกว่า Tone Color Converter

ตัวโมเดลพร้อมค่า weight เปิดให้ดาวน์โหลดไปใช้งานได้แต่จำกัดห้ามใช้งานเชิงการค้า และทาง MyShell ระบุว่าอาจจะมีแนวทางในการตรวจจับว่าเสียงสร้างขึ้นมาจากโมเดล OpenVoice อยู่

ที่มา - ArXiV, GitHub

No Description

Get latest news from Blognone

Comments

By: -Rookies-
ContributorAndroidWindowsIn Love
on 2 January 2024 - 13:45 #1302296

ปัจจุบันนี้มันมี AI เลียนเสียงตัวไหน ที่มันสามารถเลียนเสียงแบบ real time ได้ไหมครับ เห็นข่าวมิจฉาชีพปลอมเป็นคนรู้จักบ่อย ๆ สงสัยว่ามันใช้ AI เลียนเสียง หรือแค่บังเอิญเสียงคล้าย ๆ กัน


เทคโนโลยีไม่ผิด คนใช้มันในทางที่ผิดนั่นแหละที่ผิด!?!

By: KuLiKo
ContributoriPhoneWindows PhoneAndroid
on 2 January 2024 - 14:41 #1302300
KuLiKo's picture

แกงค์คอลเซ็นเตอร์ถูกใจสิ่งนี้

By: Whisper
iPhoneWindows PhoneAndroidBlackberry
on 2 January 2024 - 17:06 #1302306 Reply to:1302300

เห้: ผมนายกเศรษฐา ทวีสินนะครับ ผมกำลังจะทำเรื่องกู้เงินด่วนกับ IMF เพื่อเอามาใช้ในโครงการแจกเงิน แต่ลืมเอาบัตรมา ช่วยโอนค่าดำเนินการให้ 1000 บาททีครับ