วันนี้ทาง PyThaiNLP ได้ปล่อย PyThaiNLP รุ่น 4.0 (Real) เป็นที่เรียบร้อย โดย PyThaiNLP เป็นชุดคำสั่งสำหรับงานประมวลผลภาษาไทย เพื่อใช้งานในการวิเคราะห์ข้อมูลภาษาไทย
สำหรับรุ่น 4.0 นี้เน้นไปเรื่องการปรับปรุงประสิทธิภาพเป็นหลัก ปรับปรุงการตัดคำ แก้ไขปัญหาด้านโมเดล
ส่วนความสามารถใหม่กับโมเดลใหม่ของ PyThaiNLP 4.0 มีดังนี้
- Thai NER v2.0 - โมเดลระบุนามเฉพาะ ที่ช่วยระบุชื่อคน สถานที่ ในข้อความภาษาไทย ได้พัฒนาขึ้นรุ่นใหม่ พร้อมกับจำนวนข้อมูลที่มากกว่าเดิม
- เพิ่มความสามารถในการแปลงรูปแบบการแสดงวันเวลาของไทย ให้กลายเป็น datetime แบบง่าย ๆ
- เพิ่มความสามารถใหม่ในด้านการวิเคราะห์ภาษาไทยสำหรับงานด้านบทกวี วรรณกรรม ของภาษาไทย khavee เช่น ตรวจสอบกลอน 8 หรือกลอน 4 ตามหลักฉันทลักษณ์, ตรวจสอบความถูกต้องการสัมผัสระหว่างคำ เป็นต้น
นอกจากนี้ยังได้ปรับปรุงเครื่องมือตัดคำค่าเริ่มต้น ให้สามารถตัดคำได้อย่างแม่นยำมากยิ่งขึ้น และปรับปรุงการโหลดโมดูลให้สามารถเรียกใช้งานได้ไวยิ่งขึ้น
Comments
👍👍👍
..: เรื่อยไป