Mistral OCR 4 : l'IA qui lit manuscrits et 170 langues

Mistral met à jour son IA de lecture de documents (OCR) et la pousse vers les manuscrits et les langues rares. Derrière l’outil pour développeurs, l’enjeu est très concret : numériser des montagnes d’archives, jusque dans nos administrations.

Un document n’est pas qu’un bloc de texte parfaitement ordonné, dans un format bien lisible : il a une mise en page, des tableaux, des signatures, parfois une note griffonnée dans la marge ou des caractères devenus illisibles avec le temps. Ces subtilités propres à l’ère du papier, qui n’est pas encore derrière nous, sont précisément ce que Mistral souhaite intégrer dans sa nouvelle IA, OCR 4, présentée le 23 juin 2026. Ce modèle ne se limite plus à transformer une page scannée en texte, mais cherche à en restituer la structure.

La reconnaissance optique de caractères (OCR) existe depuis des décennies, mais sans nécessiter l’IA pour sa démocratisation. La nouveauté de cette version réside dans son niveau de détail. Selon le blog spécialisé MarkTechPost, OCR 4 localise chaque bloc d’une page avec des cadres de détection, le classe par type (titre, tableau, équation, signature) et attribue un score de confiance à chaque mot. Ainsi, le système qui reçoit le résultat sait non seulement ce qui est écrit, mais également où cela se trouve et à quel point la machine est fiable.

Mistral revendique un modèle compact prenant en charge 170 langues, y compris des langues peu documentées, souvent mal lues par d’autres outils. Ce modèle peut être hébergé en interne dans un seul conteneur. Le tarif est fixé à 4 dollars (environ 3,70 €) pour 1 000 pages, et tombe à 2 dollars (environ 1,85 €) en mode traitement par lots.

Le Français face à une vague de modèles chinois

Mistral n’est pas seul sur ce marché. Les années 2025 et 2026 ont vu émerger divers modèles d’OCR, principalement chinois et souvent open source, comme DeepSeek-OCR et PaddleOCR-VL. Ces modèles occupent des positions de choix dans le classement OmniDocBench, une référence du secteur. Les géants américains, tels que Google et Microsoft, restent également très compétitifs.

Pour se démarquer, Mistral met en avant deux arguments. D’abord, des annotateurs indépendants ont comparé OCR 4 à d’autres systèmes, sur plus de 600 documents réels dans plus de 12 langues, et l’ont préféré dans 72 % des cas en moyenne. Ensuite, la possibilité de faire tourner le modèle sur ses propres serveurs, sans envoyer de documents sensibles vers le cloud d’un tiers, représente un avantage significatif pour les administrations publiques et les entreprises.

Un enjeu bien concret pour OCR 4 : les archives

L’intérêt de cet outil ne réside pas seulement dans des démonstrations impressionnantes, mais dans le volume. Mistral évoque des applications déjà en place, comme la transformation de factures en champs structurés et la numérisation d’archives d’entreprise. La prise en charge des manuscrits et des tableaux complexes est essentielle, car de nombreux documents historiques sont des formulaires remplis à la main.

OCR 4 s’adresse principalement aux développeurs et aux organisations traitant des volumes importants de documents. Pour une administration ou une entreprise devant conserver ses données en interne, l’argument de l’auto-hébergement est particulièrement convaincant.

Mistral OCR 4 est disponible via API sur Mistral Studio, Amazon SageMaker, Microsoft Foundry, et prochainement sur Snowflake Parse Document.

Source : Mistral

Source
Leave a Comment

Comments

No comments yet. Why don’t you start the discussion?

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *