Mistral AI heeft een nieuwe versie van zijn OCR-technologie aangekondigd: Mistral OCR 3. Volgens het bedrijf betekent deze release een duidelijke sprong voorwaarts in het automatisch herkennen en structureren van tekst uit uiteenlopende documenttypen, variërend van formulieren en gescande documenten tot complexe tabellen en handgeschreven aantekeningen. In interne benchmarks behaalt de nieuwe versie een totale win-rate die 74 procent beter is ten opzichte van Mistral OCR 2.
OCR, oftewel Optical Character Recognition, vormt voor veel organisaties een cruciale schakel tussen ongestructureerde documenten en digitale workflows. Mistral OCR 3 is ontworpen om niet alleen tekst te extraheren, maar ook de onderliggende documentstructuur te behouden. Het model ondersteunt markdown-uitvoer die is verrijkt met HTML-gebaseerde tabellen, inclusief kolom- en rijhiërarchieën, samengevoegde cellen en kopstructuren. Daarmee kunnen downstreamsystemen beter begrijpen hoe informatie in een document is opgebouwd.
Volgens Mistral presteert OCR 3 beter dan zowel traditionele enterprise-oplossingen voor documentverwerking als meer AI-native OCR-systemen. De verbeteringen zijn vooral zichtbaar bij lastig te verwerken input, zoals formulieren met dicht op elkaar geplaatste velden, handgeschreven aanvullingen op gedrukte teksten, lage-resolutiescans en documenten met vervorming of compressie-artefacten. Ook bij complexe tabellen, bijvoorbeeld uit financiële of wetenschappelijke rapporten, zou de nieuwe versie nauwkeuriger zijn in het reconstrueren van de oorspronkelijke lay-out.
Een opvallend punt is dat Mistral OCR 3 relatief compact is in vergelijking met concurrerende modellen. Dat vertaalt zich volgens het bedrijf in lagere gebruikskosten: de prijs ligt volgens het bedrijf op twee dollar per duizend pagina’s, met een korting van vijftig procent bij gebruik van de Batch API. Daarmee komt de prijs uit op één dollar per duizend pagina’s, wat het model ook interessant maakt voor grootschalige verwerkingspijplijnen.
Developers kunnen Mistral OCR 3 integreren via de API (mistral-ocr-2512). Daarnaast is het model nu geïntegreerd in de Document AI Playground binnen Mistral AI Studio. Deze interface biedt een drag-and-dropomgeving waarin gebruikers PDF’s of afbeeldingen direct kunnen omzetten naar schone tekst of gestructureerde JSON-uitvoer, zonder zelf code te hoeven schrijven. De nieuwe OCR-versie is volledig backward compatible met Mistral OCR 2.
Mistral ziet uiteenlopende toepassingen voor de technologie, van het automatisch verwerken van facturen en operationele documenten tot het digitaliseren van archieven en het ontsluiten van technische en wetenschappelijke rapporten voor zoek- en kennissystemen. Ook voor end-to-end document understanding pipelines en toepassingen rond generatieve en agentic AI speelt OCR volgens het bedrijf een fundamentele rol.
Mistral OCR 3 is per direct beschikbaar via de API en de Document AI Playground in Mistral AI Studio. Daarmee verstevigt Mistral zijn positie in de snel groeiende markt voor AI-gedreven documentverwerking, waar nauwkeurigheid, schaalbaarheid en kostenbeheersing steeds belangrijker worden.





0 reacties