Mistral ออก API Mistral OCR อ่านข้อมูลจากเอกสาร PDF เป็น Markdown ได้ดีกว่าโมเดล OCR อื่น

By: arjin

on 7 March 2025 - 18:31 Tags:

Topics:

Mistral

Artificial Intelligence

API

OCR

Mistral เปิดตัว Mistral OCR ที่เป็น API ให้นักพัฒนาใช้ดำเนินการอ่านข้อมูลจากเอกสาร PDF ที่มาในรูปแบบแตกต่างกันไป เพื่อแปลงออกมาเป็นฟอร์แมตที่ง่ายขึ้นสำหรับให้โมเดลปัญญาประดิษฐ์เรียนรู้ต่อ

Mistral OCR สามารถจัดการข้อมูลอยู่ในเอกสารที่อาจมีหลายรูปแบบทั้งตัวหนังสือ รูปภาพ ตาราง สมการ ให้ออกมาเป็นเอาท์พุทแบบ Markdown ทำให้สามารถจัดการเอกสารต่อได้ตรงกับรูปแบบต้นฉบับมากขึ้น

Mistral บอกว่า Mistral OCR ถูกใช้งานอยู่แล้วสำหรับผู้ใช้งานแชทบอต Le Chat เมื่ออัปโหลดไฟล์เอกสารเข้ามา แต่ API นี้เปิดให้นักพัฒนาสามารถนำไปพัฒนาเพิ่มเติมได้เอง โดย API mistral-ocr-latest คิดราคาที่ 1,000 หน้าต่อดอลลาร์โดยประมาณ สามารถใช้งานได้แล้ววันนี้ผ่าน la Plateforme และเร็ว ๆ นี้สามารถใช้งานได้ผ่านผู้ให้บริการคลาวด์ที่เป็นพาร์ตเนอร์

ผลทดสอบโดย Mistral ด้วยเอกสารที่เป็นตัวหนังสือเท่านั้น ทั้งงานวิจัยที่มีสมการคณิตศาสตร์ ตาราง ข้อมูลผสมผสาน หรือมาจากการสแกน พบว่า Mistral OCR ได้สูงกว่าโมเดลปัญญาประดิษฐ์หรือบริการ OCR ของรายอื่น

ที่มา: Mistral

No Description