Mistral AI : OCR 4 dépasse 72 % de ses rivaux en tests aveugles

Le brief IA que les pros lisent chaque soir
Les 7 actus IA du jour, décryptées en 5 min. Gratuit.
Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.
Choisis ton rythme
Gratuit · Pas de spam · Désabonnement en 1 clic
Mistral AI : OCR 4 dépasse 72 % de ses rivaux en tests aveugles
Mistral AI a lancé OCR 4, un nouveau modèle capable de lire du texte à partir de documents tels que des PDF, des fichiers Word et des présentations PowerPoint.
Contrairement aux versions précédentes, OCR 4 ne se contente pas d'extraire du texte brut. Il identifie également la position de chaque élément sur la page et son rôle - qu'il s'agisse d'un titre, d'un tableau, d'une équation ou d'une signature. Cette classification par blocs permet de diviser automatiquement les documents en sections significatives, ce qui est utile pour les intégrer dans des systèmes de recherche ou pour permettre à des agents d'IA de les traiter. Le modèle fournit également des scores de confiance, estimant le degré de certitude concernant chaque mot ou page qu'il lit.
Selon Mistral, le modèle surpasse tous les concurrents testés dans les benchmarks. OCR 4 prend en charge 170 langues et fonctionne bien même avec des langues moins courantes. Lors d'un test à l'aveugle avec plus de 600 documents, des évaluateurs indépendants ont préféré les résultats d'OCR 4 dans 72 % des cas par rapport aux modèles concurrents. Le modèle est disponible via l'API, Mistral Studio et Microsoft Foundry. Son coût est de 4 $ par 1 000 pages, ou 2 $ en mode batch.
Brief IA — L'actualité IA en français
L'essentiel de l'actualité de l'intelligence artificielle, décrypté et expliqué chaque jour.