Google Translate ประกาศนำอัลกอริทึมแบบ Neural Networks มาใช้แทนการแปลแบบ Phrase-Based เดิม โดยเริ่มจากการแปลจีนเป็นอังกฤษก่อน ช่วยให้การแปลแม่นยำและใกล้เคียงกับมนุษย์แปลมากขึ้น
ที่ผ่านมา ระบบการแปลของ Google Translate ใช้เทคนิคที่เรียกว่า Phrase-Based Machine Translation (PBMT) ซึ่งจะตัดประโยคต้นฉบับเป็นคำๆ หรือวลี แล้วแปลแต่ละส่วนแยกจากกัน คุณภาพของการแปลจึงอาจไม่เป็นธรรมชาติมากนัก ช่วงหลังกูเกิลเริ่มนำเทคนิค Neural Machine Translation (NMT) มาใช้แทน โมเดลนี้จะมองภาพรวมการแปลทั้งประโยค แทนการแปลแบบแยกส่วน
ภาพสาธิตการแปลแบบ NMT จากภาษาจีนเป็นอังกฤษ ที่มองคำในประโยคต้นฉบับต่อกันเป็นเวกเตอร์ (encoder) จากนั้นตอนแปล (decoder) จะถอดความมาทีละคำ แต่จะยังดูบริบทของคำโดยรอบด้วย
ในช่วงแรก เทคนิค NMT ยังมีความแม่นยำใกล้เคียงกับ PBT แต่ยังทำงานได้ไม่เร็วพอและคุณภาพการแปลยังไม่ดีพอ ซึ่งทีมวิจัยของกูเกิลก็ใช้เวลาอีกหลายปีกว่าจะพัฒนา NMT ให้ดีขึ้นกว่า PBMT (รวมถึงใช้ระบบ machine learning ทั้ง TensorFlow และชิป TPU เข้าช่วยเรื่องความเร็ว)
ตอนนี้เทคนิค NMT ก็ช่วยลดความผิดพลาดของการแปลลงได้ 55-85% จนอยู่ในระดับที่กูเกิลพร้อมนำมาใช้งานจริงกับ Google Translate แล้ว โดยจะใช้กับการแปลจีนเป็นอังกฤษก่อน ส่วนภาษาอื่นๆ จะตามมาในอนาคต
เปรียบเทียบคุณภาพการแปลระหว่าง PBMT, NMT, การแปลด้วยมนุษย์
ที่มา - Google Research Blog
Comments
ดีงาม
ชอบ แปลดีขึ้นเยอะ
เจ๋งเลยอ่ะ
..: เรื่อยไป
จะเล่น เอโรเกะ รู้เรื่องเพิ่มขึ้นแล้ว 3
ว่าแต่จะเอาคำมาแปลได้อย่างไร บางเอโรเกะต้องใช้XP 32 bit ใน Virtual Machine เจอประจำพวกบ่นเล่นในWindows 10 ไม่ได้
มีโปรแกรม ดึงคำญี่ปุ่นออกมาอยู่ครับ
ถ้าไม่มีคนทั่วไปเข้าไปช่วยมั่วแปลภาษา ผมว่ามันคงจะดีขึ้นเรื่อย ๆ ไม่งั้นก็เละอีกเหมือนภาษาไทยแน่ ๆ
ภาษาไทยมีคนมั่ว ช่วยแปลด้วยหรอ
คือถ้าเคยใช้ตัวนี้ตั้งแต่ต้น ๆ จะเห็นเรื่องการแนะนำคำแปลตั้งแต่แรกเลย แล้วคำแปลมันจะเปลี่ยนไปเรื่อย ๆ ตามคนที่แนะนำเข้าไปน่ะครับ พูดแล้วคงไม่เห็นภาพนักลองยกตัวอย่างดูซักคำเช่น King
ตอนแรก = พระราชา
ต่อมา = พระเจ้าอยู่หัว
ต่อมา = พระบาทสมเด็จพระเจ้าอยู่หัว
ต่อมา = ก็ข้อสามแล้วตามด้วยชื่อ
ซื่งจริง ๆ แล้วคำว่า King เป็นคำโดยรวม ที่ไม่ได้เจาะจงว่าเป็นบุคคลใด สามารถใช้ได้กับ King ทุกประเทศ แต่หลัง ๆ นี่ไม่ว่า King องค์ไหนก็จะกลายเป็นคำแปลแบบที่สาม หรือคำแปลแบบที่สี่แล้วตามด้วยชื่อของ King ในประเทศอื่นแทน
แบบไงล่ะ เละ
ถ้าจะเละแบบนั้นก็ใช้พจนานุกรมกับเอกสารต่างๆ ประกอบการเรียนรู้ AI รวมถึงภาพยนตร์หรือวีดีโอแต่ละภาษามาใช้เป็นฐานข้อมูลน่าจะดีกว่า แทนที่จะให้คนป้อนแล้วเละซะแบบนั้น
Get ready to work from now on.
คนแก้ศัพท์ชอบแก้เป็นคำหยาบ เช่น แก้จุ๋มจิ๋มเป็น hee
ภาษาไทย ร้องไห้หนักมาก...
+1024
สรุปแล้ว การแปลจากจีนไปอังกฤษ ด้วย Neural Machine Translation คือตอนนี้บุคคลทั่วไป สามารถใช้งานได้แล้วใช่ไหมครับ ผมอ่านแล้วงงๆ หรือผมเบลอเองนะ ฮ่าๆ
แปลดีขึ้นนะ แต่ทำไมข้อมูลเรื่องวันที่ 26 หายไปหว่า
นึกว่า อัลกริทริม เดิมของ ทรานซะเลส นี่ ดูบริบท ข้างๆด้วย
เพราะต้องการความเร็วนี่เอง เล่นแปลแบบว่า คำต่อคำ ถึงว่าแปลแบบไม่ค่อยได้ความ