หลังจาก Unicode 6.0 ออกมาตั้งแต่ปลายปี 2010 ตอนนี้ก็ถึงเวลาอัพเดตตารางอักษรกันอีกรอบ โดยรอบนี้มีตัวอักษรเพิ่มเข้ามาทั้งหมด 732 ตัวอักษร กลุ่มใหญ่ที่สุดคงเป็นกลุ่ม Emoji ที่มีเพิ่มเข้ามากว่า 200 ตัวอักษร ที่ใกล้ตัวเราสักหน่อยคงเป็นอักษรภาษาลาวที่มีการเพิ่มสระเข้ามาสองตัว และเพิ่มระบบการกำหนดขอบเขตภาษาไทยและภาษาลาวเข้ามา
ระบบการหาขอบเขตของคำที่เพิ่มเข้ามานั้นคือ Grapheme Cluster Break ที่เป็นคุณสมบัติใหม่ของตัวอักขระ ทำให้คำไม่ถูกตัดอย่างไม่สมเหตุสมผล เช่น สระ "า" หลังตัวอักษรกลับถูกแยกออกเป็นอีกคำเป็นต้น
หลังจากที่ระบบปฎิบัติการต่างๆ รองรับ Unicode รุ่นใหม่นี้กันแล้ว การเลือกคำต่างๆ ในภาษาไทยน่าจะทำได้อย่างเป็นธรรมชาติกับคนไทยมากขึ้น
ที่มา - Unicode
Comments
หรือว่า windows phone รออันนี้อยู่ถึงยังไม่ลงไทยมาให้ อิอิ
Emojo???
Emoji ที่ว่านี่ใช่อันเดียวกับ icon การ์ตูนใน iPhone ใน Whatsapp รึเปล่าครับ?!?
ใช่แล้วครับ คงไม่มีตัวอื่นแล้วละนะครับ
เข้าไปดูในเวปที่มา ก็จะเห็นตัวอย่างครับ ในนั้นยกตัวอย่างมาสองรูปคือรูปเต็นท์กับรูปปั๊มจ่ายน้ำมัน ถ้าแสดงเป็น text style ก็จะเห็นอีกแบบนึง ถ้าแสดงเป็น emoji style ก็จะเห็นเป็นรูปกราฟฟิค
สงสัยต่อว่า นี่คือ icon มาตรฐาน ที่ทุก app สามารถเลือกใช้ได้เหมือนกันหรอ? หรือว่าเหมือนกันแค่ text style ส่วนรูป icon แตกต่างกันมั้ย
มาตรฐานคือ text style ครับ ส่วน icon แล้วแต่ app
ดูได้จาก emoji ของ LINE กับ Whatsapp บน Android จะมี icon ต่างกัน
ผมเดาว่ามันน่าจะมาจากภาษาญี่ปุ่น
e(เอ๊ะ) = ภาพ
moji = ตัวอักษร
รวมกันแล้วก็นะจะประมาณว่า รูปภาพที่ใช้แทนอักษร
รายละเอียดเกี่ยวกับเรื่อง grapheme cluster boundary กับภาษาไทย-ลาวครับ:
Unicode 6.1 and Thai-Lao Scripts
ไม่ใช่ว่าเพิ่มระบบตัดคำเข้ามา แต่เป็นการแก้ระบบ clustering เดิมที่มีปัญหาอยู่ ตัวปัญหาเป็นเรื่องการเลื่อนเคอร์เซอร์และการกด Delete ครับ ไม่ใช่เรื่องการตัดคำ
แก้ไขตามคำแนะนำครับ
lewcpe.com, @wasonliw