Tags:
Node Thumbnail

Mistral เปิดตัว Mistral OCR ที่เป็น API ให้นักพัฒนาใช้ดำเนินการอ่านข้อมูลจากเอกสาร PDF ที่มาในรูปแบบแตกต่างกันไป เพื่อแปลงออกมาเป็นฟอร์แมตที่ง่ายขึ้นสำหรับให้โมเดลปัญญาประดิษฐ์เรียนรู้ต่อ

Mistral OCR สามารถจัดการข้อมูลอยู่ในเอกสารที่อาจมีหลายรูปแบบทั้งตัวหนังสือ รูปภาพ ตาราง สมการ ให้ออกมาเป็นเอาท์พุทแบบ Markdown ทำให้สามารถจัดการเอกสารต่อได้ตรงกับรูปแบบต้นฉบับมากขึ้น

Mistral บอกว่า Mistral OCR ถูกใช้งานอยู่แล้วสำหรับผู้ใช้งานแชทบอต Le Chat เมื่ออัปโหลดไฟล์เอกสารเข้ามา แต่ API นี้เปิดให้นักพัฒนาสามารถนำไปพัฒนาเพิ่มเติมได้เอง โดย API mistral-ocr-latest คิดราคาที่ 1,000 หน้าต่อดอลลาร์โดยประมาณ สามารถใช้งานได้แล้ววันนี้ผ่าน la Plateforme และเร็ว ๆ นี้สามารถใช้งานได้ผ่านผู้ให้บริการคลาวด์ที่เป็นพาร์ตเนอร์

ผลทดสอบโดย Mistral ด้วยเอกสารที่เป็นตัวหนังสือเท่านั้น ทั้งงานวิจัยที่มีสมการคณิตศาสตร์ ตาราง ข้อมูลผสมผสาน หรือมาจากการสแกน พบว่า Mistral OCR ได้สูงกว่าโมเดลปัญญาประดิษฐ์หรือบริการ OCR ของรายอื่น

ที่มา: Mistral

No Description

Get latest news from Blognone

Comments

By: kora on 7 March 2025 - 20:11 #1335383

ถอดภาษาไทยได้ไหมครับ เมื่อกี้ลองบน Le Chat ถอดผิดเยอะ กลายเป็นคนละเรื่องไปเลย