Tags:
Node Thumbnail

หนึ่งในปัญหาใหญ่ของวงการภาพยนตร์, ซีรีส์ที่ทุกวันนี้มีภาพยนตร์ ซีรีส์คุณภาพดีมากมาย ที่ไม่ใช่ภาษาท้องถิ่นของประเทศที่ฉายโดยเฉพาะภาษาอังกฤษ คือความไม่พอใจของคนดู ที่ไม่อยากอ่านซับไตเติล โดยเฉพาะในสหรัฐ Hudson AI สตาร์ทอัพภายใต้ Creative Labs ของซัมซุงในเกาหลีใต้ เลยพยายามจะแก้ปัญหานี้ด้วย AI

ผลสำรวจจาก Morning Consult ของสหรัฐ สำรวจผู้ชมใน 15 ประเทศทั่วโลก พบว่ามีเพียงผู้ชมในเกาหลีใต้และจีนเท่านั้น ที่เลือกตอบว่าพอใจในการอ่านซับไตเติลสูงถึง 70% ส่วนประเทศฝั่งตะวันตกอย่างสหรัฐหรือยุโรป ส่วนใหญ่จะชอบให้ลงเสียงพากย์ทับมากกว่า

No Description

Hyunjin Shin ซีอีโอและผู้ก่อตั้ง Hudson AI บอกว่าในอุตสาหกรรมภาพยนตร์ ไม่ใช่ภาพยนตร์หรือซีรีส์ทุกเรื่อง แม้นักวิจารณ์จะชอบมากแค่ไหน ก็ใช่ว่าจะถูกซื้อไปฉายในประเทศหนึ่ง พร้อมกับการลงทุนแปลและพากย์เสียงทับ อย่างกรณีของ Parasite ของเกาหลีใต้ที่ได้ออสการ์ แต่ฉายในสหรัฐแค่ไม่กี่โรง แถมมีแต่ซับไตเติลด้วย (ซึ่ง Bong Joon-ho ผู้กำกับพูดบนเวทีลูกโลกทองคำว่า ซับไตเติลเป็นแค่ one-inch barrier) ซึ่งประเด็นนี้กลายเป็นอุปสรรคให้แง่ธุรกิจสำหรับผู้จัดจำหน่ายภาพยนตร์ต่างประเทศ

Hudson AI เลยถูกตั้งขึ้นมาเพื่อแก้ปัญหานี้ โดยเจ้าตัวเดิมทำงานอยู่ในซัมซุงอิเล็คททรอนิคส์ ที่เกาหลีใต้ และเสนอไอเดียนี้ ก่อนจะได้รับเลือกให้เข้าร่วมโครงการ accelerator ภายในบริษัทที่ชื่อว่า Creative Labs (C-Labs) และตั้งเป้าว่าจะแก้ปัญหาด้านกำแพงภาษา ให้กับอุตสาหกรรมภาพยนตร์ ด้วยการใช้ AI มาแปลงเสียงพูด พร้อมปรับปากตัวละคร ให้เป็นภาษาท้องถิ่น

กระบวนการในแปลงเสียงพูดมีอยู่หลักๆ ทั้งหมด 3 ส่วนคือ

  • แปลภาษา ด้วยการใช้โมเดล LLM ที่มีอยู่ในตลาด พร้อมเปิดให้นักแปลเจ้าของภาษามาขัดเกลาการถอดความสุดท้ายอีกครั้ง
  • Voice Conversion กระบวนการนี้ทาง Hudson AI สร้างโมเดลในลักษณะ text-to-speech ขึ้นมาเอง โดยโมเดลสามารถเรียนรู้และรักษาโทนเสียง น้ำเสียง และความนุ่มลึกของเสียงนักแสดงต้นฉบับเอาไว้ให้ได้มากที่สุด เพื่อรักษาอรรถรสของฉากนั้นๆ
  • Lip Sync เป็นอีกโมเดล AI ที่ Hudson AI พัฒนาขึ้นมาเอง ในการปรับรูปหน้าช่วงปากของนักแสดง ให้ขยับออกมาให้เคียงเสียงพูด ที่ถูกแปลออกมาแล้วได้มากที่สุด

No Description

Shin บอกว่า จุดเด่นของ Hudson AI คือความเป็นธรรมชาติ ของน้ำเสียงและการขยับปากของนักแสดง ซึ่งถึงแม้เทคโนโลยี text-to-speech จะมีมานานแล้ว แต่ก็ยังคงทำได้ไม่ดีในการถ่ายทอดเรื่องนี้ รวมถึงบอกด้วยว่าเป้าหมายของบริษัท ไม่ใช่การมาแทนที่การลงเสียงพากย์ แต่หวังเพียงแค่ช่วยอำนวยความสะดวกและกำแพงด้านการดูภาพยนตร์, ซีรีส์ต่างประเทศเป็นหลัก

ปัจจุบัน Hudson AI เพิ่งรับเงินลงทุนรอบ seed funding ไป 700 ล้านวอน (ราวๆ 18 ล้านบาท) ประมาณต้นปีที่แล้ว และเริ่มทดสอบกับบริษัทภาพยนตร์ ทั้งภายในประเทศและต่างประเทศแล้ว โดยวางแผนจะให้บริการจริงๆ ในรูปแบบของ SaaS

Get latest news from Blognone

Comments

By: errin on 20 June 2024 - 17:11 #1315038

By Hudson

By: 7elven
ContributoriPhoneWindows PhoneAndroid
on 20 June 2024 - 18:35 #1315041

ให้เสียงภาษาไทยโดย Hudson

By: Azymik on 20 June 2024 - 19:13 #1315045

คือความไม่พอในของคนดู

คือความไม่พอใจของคนดู

By: Mediumrare
AndroidWindows
on 20 June 2024 - 19:57 #1315048 Reply to:1315045

พูดบนเวทีออสการ์ว่า

ลูกโลกทองคำ, Golden Globe

By: nismod
TraineeWriteriPhoneAndroid
on 20 June 2024 - 21:02 #1315060 Reply to:1315048
nismod's picture

จำสลับ 555 ขอบคุณครับ

By: Hoo
AndroidWindows
on 20 June 2024 - 20:23 #1315054

เห็นชื่อ Hudson แล้วนึกถึง Bomberman 😅

By: Mediumrare
AndroidWindows
on 21 June 2024 - 06:44 #1315078

ผมเพิ่งมาลองนึกดู มันมีลู่ทางจะกลายเป็นนวัตกรรมเปลี่ยนโลกเหมือนกันนะ นึกภาพตามคือพอได้คนเกลาเสร็จแล้ว เสียงก็จะออกมาเป็นประโยคตรงกับที่คนเกลาทำไว้ โดยที่น้ำเสียงก็จะใกล้เคียงต้นฉบับ (ซึ่งตรงนี้ผมว่าสำคัญที่สุด) และปากก็จะขยับตรงอีกต่างหาก (ตรงนี้น่าจะทำยากสุด แต่ผมมองเป็นแค่ extra) มันพอมองออกว่าแรก ๆ มันไม่เนียนหรอก เหมือนงานวิดีโอจาก AI เมื่อไม่กี่ปีก่อน แต่ถ้าให้เวลาหรือเงินเพิ่มเข้าไปมันก็น่าคิด

By: zipper
ContributorAndroid
on 21 June 2024 - 10:36 #1315104

จะเป็นไปได้ไหมว่าในอนาคตเวลาทำอนิเมชั่นไม่ต้องทำปาก เดี๋ยว AI จะขยับปากให้เองตามเสียงพากย์ของแต่ละประเทศ

By: Hoo
AndroidWindows
on 21 June 2024 - 14:23 #1315138 Reply to:1315104

ผมว่าแนวโน้มสูงมาก
เผลอๆเอาอัตลักษณ์น้ำเสียงของคนพากษ์ต้นฉบับ
ไปพูดเป็นภาษาแต่ละประเทศเองได้ด้วย