Mistral เปิดตัว Mistral OCR ที่เป็น API ให้นักพัฒนาใช้ดำเนินการอ่านข้อมูลจากเอกสาร PDF ที่มาในรูปแบบแตกต่างกันไป เพื่อแปลงออกมาเป็นฟอร์แมตที่ง่ายขึ้นสำหรับให้โมเดลปัญญาประดิษฐ์เรียนรู้ต่อ
Mistral OCR สามารถจัดการข้อมูลอยู่ในเอกสารที่อาจมีหลายรูปแบบทั้งตัวหนังสือ รูปภาพ ตาราง สมการ ให้ออกมาเป็นเอาท์พุทแบบ Markdown ทำให้สามารถจัดการเอกสารต่อได้ตรงกับรูปแบบต้นฉบับมากขึ้น
Mistral บอกว่า Mistral OCR ถูกใช้งานอยู่แล้วสำหรับผู้ใช้งานแชทบอต Le Chat เมื่ออัปโหลดไฟล์เอกสารเข้ามา แต่ API นี้เปิดให้นักพัฒนาสามารถนำไปพัฒนาเพิ่มเติมได้เอง โดย API mistral-ocr-latest คิดราคาที่ 1,000 หน้าต่อดอลลาร์โดยประมาณ สามารถใช้งานได้แล้ววันนี้ผ่าน la Plateforme และเร็ว ๆ นี้สามารถใช้งานได้ผ่านผู้ให้บริการคลาวด์ที่เป็นพาร์ตเนอร์
ผลทดสอบโดย Mistral ด้วยเอกสารที่เป็นตัวหนังสือเท่านั้น ทั้งงานวิจัยที่มีสมการคณิตศาสตร์ ตาราง ข้อมูลผสมผสาน หรือมาจากการสแกน พบว่า Mistral OCR ได้สูงกว่าโมเดลปัญญาประดิษฐ์หรือบริการ OCR ของรายอื่น
ที่มา: Mistral
Topics:
Mistral
Artificial Intelligence
API
OCR
Continue reading...
Mistral OCR สามารถจัดการข้อมูลอยู่ในเอกสารที่อาจมีหลายรูปแบบทั้งตัวหนังสือ รูปภาพ ตาราง สมการ ให้ออกมาเป็นเอาท์พุทแบบ Markdown ทำให้สามารถจัดการเอกสารต่อได้ตรงกับรูปแบบต้นฉบับมากขึ้น
Mistral บอกว่า Mistral OCR ถูกใช้งานอยู่แล้วสำหรับผู้ใช้งานแชทบอต Le Chat เมื่ออัปโหลดไฟล์เอกสารเข้ามา แต่ API นี้เปิดให้นักพัฒนาสามารถนำไปพัฒนาเพิ่มเติมได้เอง โดย API mistral-ocr-latest คิดราคาที่ 1,000 หน้าต่อดอลลาร์โดยประมาณ สามารถใช้งานได้แล้ววันนี้ผ่าน la Plateforme และเร็ว ๆ นี้สามารถใช้งานได้ผ่านผู้ให้บริการคลาวด์ที่เป็นพาร์ตเนอร์
ผลทดสอบโดย Mistral ด้วยเอกสารที่เป็นตัวหนังสือเท่านั้น ทั้งงานวิจัยที่มีสมการคณิตศาสตร์ ตาราง ข้อมูลผสมผสาน หรือมาจากการสแกน พบว่า Mistral OCR ได้สูงกว่าโมเดลปัญญาประดิษฐ์หรือบริการ OCR ของรายอื่น
ที่มา: Mistral
Topics:
Mistral
Artificial Intelligence
API
OCR
Continue reading...