ทีมวิจัยจากญี่ปุ่นนำเสนอปัญญาประดิษฐ์เฉพาะทางสำหรับแปลการ์ตูน (มังงะ - manga) โดยนำภาพในการ์ตูนเข้ามาประกอบเพื่อให้คุณภาพการแปลสูงขึ้น
กระบวนแปลภาษาในการ์ตูนนั้นมีความยากกว่าเนื้อหาปกติเพราะข้อความในแต่ละช่องของการ์ตูนมักเป็นข้อความสั้นๆ บางครั้งหากไม่มองเนื้อหาโดยรวมแล้วก็ถึงกับแปลไม่ได้ ทำให้ทีมวิจัยสร้างระบบการแปลแบบมองบริบทจากหลายมุมมอง (multimodal context-aware) โดยมองทั้งลำดับของภาพ, ลำดับของข้อความ, และบริบทผู้พูดข้อความนั้นๆ เช่น เพศของผู้พูด
ทีมงานระบุว่าระบบการแปลที่มองบริบทมาเป็นส่วนร่วมเช่นนี้น่าจะใช้งานประเภทอื่นๆ ได้ด้วย เช่น การทำคำบรรยายภาพยนตร์
เนื่องจากตอนนี้ไม่มีชุดข้อมูลสำหรับวัดประสิทธิภาพของการแปลการ์ตูนโดยตรง ทีมงานจึงสร้างชุดข้อมูลขึ้นมาใหม่ จากการ์ตูนรวม 214 หน้า และชุดข้อมูลจากการ์ตูนที่มีการแปลไปก่อนหน้านี้แล้ว 258 หน้า
ที่มา - arXiv
Comments
ต้องมีฐานข้อมูลการ์ตูนเยอะพอสมควรเลยนะเนี่ยถึงทำแบบนี้ได้
กำลังสงสัยว่า... ??
บล็อกส่วนตัวที่อัพเดตตามอารมณ์และความขยัน :P
เอา H มาลงฐานข้อมูลด้วยสินะ
การ์ตูนเกี่ยวกับ History สินะครับ
interesting...
แล้วก็ต้องจำลักษณะนิสัยของตัวละครด้วยนะ เพราะบางตัวพูดในบริบทเดียวกันก็ใช้คำคนล่ะแบบ
The Dream hacker..
ก้าวสำคัญวงการแปล
ถ้าพัฒนาดีขึ้นหน่อย และการแปลทำได้ดีใกล้เคียงกับนักแปลมืออาชีพ การทำตลาด E-Manga ในต่างประเทศจะง่ายขึ้นเลย เพราะใช้คนแปลน้อยลง ทำแค่แพลตฟอร์มเดียว ขายประเทศอื่นได้เลย มีระบบแยกภาษาตามประเทศที่ทำตลาด เงินไหลเข้าทั้งเจ้าของผลงานและผู้ถือลิขสิทธิ์ต้นทาง
อีกอย่างก็ไม่ต้องรอตัวแทนเข้ามาซื้อสิทธิ์ไปแปลขายประเทศตัวเองต่อ ไม่มีล็อค Region แบบเดียวกับบริการ Streaming ที่มี Subtitle แปลหลายภาษาในเนื้อหาเลย
ความล้มเหลว คือจุดเริ่มต้นสู่ความหายนะ มีผลกระทบมากกว่าแค่เสียเงิน เวลา อนาคต และทรัพยากรที่เสียไป - จงอย่าล้มเหลว
คลีนด้วยในตัว รึเปล่านิ
ภาพยนต์ => ภาพยนตร์
ถ้าในวงการภาพยนตร์เอาซับของ FF7หมี่หยก ไปแปลกลับเป็นภาษาอื่นๆ คงมันดี
ซับในตำนาน 555
ซับในตำนาน 555
レーネ น่าจะแปลว่า Rene` มากกว่านะ ....
นายก็คิดเหมือนชั้นใช่มั้ย B1
ภาษาญี่ปุ่น บริบทเยอะจริง
ผู้ใหญ่ ผู้น้อย
ผู้หญิง ผู้ชาย
ในครอบครัว ไม่ใช่ในครอบครัว
สนิท ไม่สนิท
สุภาพ ไม่สุภาพ
ฯลฯ