Futura vous présente une sélection des meilleurs logiciels OCR. © pxhere

Tech

Logiciels OCR : quels sont les meilleurs ?

Question/RéponseClassé sous :Outils PDF , logiciels , Reconnaissance optique de caractères

Convertir des documents imprimés ou scannés en fichiers numériques consultables et éditables est possible si l'on dispose d'un logiciel OCR. Aujourd'hui, Futura vous présente les meilleurs d'entre eux, que ce soit pour une utilisation ponctuelle ou professionnelle.

Un logiciel OCR ? Ce terme ne vous est pas forcément familier, rappelons donc rapidement en quoi cela consiste avant de vous présenter les logiciels qui semblent les plus intéressants. OCR est l'acronyme des termes anglais « Optical Character Recognition », c'est-à-dire reconnaissance optique de caractères, en français.

Cette nouvelle technologie est extrêmement utile, car elle permet de convertir des documents imprimés ou scannés en fichiers dans un format connu (Word, PDF, texte, etc.), offrant ainsi la possibilité de les éditer et les modifier à sa convenance. Concrètement, c'est un outil qui sert à gérer vos documents imprimés et numérisés en les rendant plus accessibles, organisés et sécurisés.

On comprend donc très vite l'utilité d'un tel logiciel dans la vie d'une entreprise souhaitant centraliser et protéger l'ensemble de ses documents ou bien d'un particulier désirant gérer efficacement toutes ses factures, papiers administratifs, courriers reçus, documents de travail ou polycopiés pour ses études. Dans tous les cas, il en résulte un gain de productivité très appréciable.

Les logiciels OCR prennent majoritairement deux formes :

  • Les services en ligne gratuits qui sont plutôt réservés à une utilisation ponctuelle, car limités dans leurs fonctions et incapables de traiter un grand nombre de documents simultanément.
  • Les logiciels professionnels, qui sont plus précis dans la reconnaissance des caractères, permettent un traitement par lot et prenant en charge plus de formats.

Les meilleurs logiciels OCR gratuits 

LightPDF

LightPDF est un service OCR en ligne qui permet de convertir en quelques clics un document ou une image en un fichier éditable.

Sa formule OCR Basic est entièrement gratuite. Disposant d'une interface d'une extrême simplicité, l'utilisateur n'a qu'à sélectionner son document PDF ou son image au format JPG ou PNG, choisir le langage employé parmi 25 disponibles et cliquer sur un bouton pour le convertir au format TXT.

LightPDF propose aussi une formule VIP payante, qui dépend du nombre de pages que l'utilisateur veut convertir. À ce moment-là, la reconnaissance des caractères est améliorée et le logiciel prend en charge toutes les langues employées (contre une seule pour OCR Basic). En outre, le document peut également être converti, en plus du format TXT, en DOCX, XLSX, PPTX, PDF et RTF, tout en conservant sa mise en page d'origine.

LightPDF permet de convertir et télécharger un document en quelques secondes. © LightPDF

Online OCR

Online OCR est un service en ligne entièrement gratuit qui permet de convertir jusqu'à 15 fichiers par heure en mode Invité. Si l'utilisateur s'enregistre, il a la possibilité de convertir des documents PDF comportant plusieurs pages (contre une seule normalement) et a accès à des fonctions supplémentaires.

Online OCR peut à ce moment-là convertir des documents PDF et des images au format TIFF, JPG, BMP, PCX, PNG et GIF. Les fichiers d'archives ZIP contenant des fichiers aux formats cités peuvent aussi être traités par Online OCR.

La taille maximale des fichiers est de 200 Mo et il est préférable que les images soumises aient une résolution de 200-400 DPI afin que la reconnaissance des caractères soit optimale. La conversion d'Online OCR se fait dans l'un des 5 formats de sortie : document Adobe PDF, Microsoft Word, Microsoft Excel, document RTF ou TXT.

En ce qui concerne les langues compatibles, Online OCR en détecte 46 dont toutes celles les plus parlées dans le monde à l'heure actuelle. Point intéressant et non disponible sur la plupart des services en ligne gratuits, la mise en page du document converti est conservée à l'identique.

Online OCR garde la mise en page du document original. © Online OCR

New OCR

New OCR est un service en ligne 100 % gratuit qui permet de convertir de nombreux formats de documents tels que PDF, JPG, PNG, GIF, BMP, TIF et Djvu (format d'archives). En sortie, l'utilisateur a le choix entre 3 formats : PDF, DOC et TXT.

Sa grande force est de reconnaître 150 langages, dont certains introuvables sur d'autres outils en ligne (vieux français, vieil anglais, breton, occitan, grec ancien, équation mathématique, etc.).

Pour s'en servir, il suffit d'« uploader » un fichier compatible et de renseigner les différents langages qu'il contient. Ensuite, l'utilisateur peut prévisualiser le résultat et changer l'orientation de la page. Il a aussi la possibilité d'employer directement Google Translate et Bing Translator s'il a besoin de traduire son document, mais également de l'éditer en ligne avec Google Doc.

Enfin, il peut partager les fichiers convertis sur les réseaux sociaux Facebook et Twitter.

New OCR prend en charge environ 150 langages dont des langues mortes et les équations mathématiques. © NewOCR.com

Les meilleurs logiciels OCR professionnels

PDFelement Pro 

PDFelement Pro est plus qu'un simple logiciel OCR, c'est une véritable alternative à Adobe Acrobat en tant qu'éditeur de PDF. Néanmoins, s'il est devenu une référence, c'est bien grâce à sa reconnaissance optique des caractères qui est de très loin la meilleure que l'on peut trouver sur le marché sur le plan du rapport qualité/prix.

S'il est limité quant au nombre de langues prises en charge (anglais, français, allemand, espagnol, italien, japonais, néerlandais et chinois), il est en revanche très bon en ce qui concerne la qualité de la reconnaissance et la multitude de fonctionnalités qu'il propose.

Pour ce qui est de la conversion, PDFelement Pro est un éditeur de PDF, donc, fort logiquement, les documents à convertir doivent être dans ce format. En sortie, s'il peut créer des fichiers aux formats Word, Excel, PowerPoint et Texte, il est aussi possible d'en générer dans de multiples formats d'image, mais également en HTML, ePUB (format des liseuses), etc., tout en préservant la qualité d'origine.

Contrairement aux services en ligne gratuits, il est capable d'effectuer des conversions par lot, augmentant ainsi de manière significative la productivité de l'utilisateur. En outre, il est en mesure de transformer des PDF scannés en documents Office modifiables et de sécuriser les fichiers en y ajoutant des mots de passe ou des autorisations.

Pour le reste, il dispose de fonctions d'éditeur de PDF avancées :

  • pour le texte, il est possible de changer la taille, la police de caractères, etc. ;
  • des images peuvent être ajoutées, supprimées, copiées, collées, tournées, replacées, extraites et recadrées ;
  • l'utilisateur peut adjoindre des commentaires, coller des post-its, utiliser des outils de dessin personnalisés, etc.

PDFelement Pro fonctionne sous Windows et macOS. S'il est disponible par abonnement à 79 euros par an, il est nettement plus avantageux d'acquérir une licence perpétuelle à 109 euros. Si vous demandez à être convaincu, alors testez dans un premier temps gratuitement sa version d'essai.

PDFelement dispose de l’outil OCR ayant le meilleur rapport qualité/prix du marché. © Wondershare

OmniPage Standard

OmniPage Standard se présente comme le logiciel OCR le plus vendu au monde et se targue de compter parmi ses clients des entreprises à renommée internationale (BNP, Airbus, Axa, etc.).

Son objectif est de numériser et convertir des documents papier, des PDF ou des images en fichiers compatibles avec les logiciels les plus populaires : Nuance Power PDF, Word, Excel, PowerPoint, Corel, Wordperfect, etc.

Les documents convertis sont en tout point semblables aux originaux (texte, mais également colonnes, tableaux, graphiques, etc.) et modifiables rapidement. OmniPage Standard peut traiter les conversions par lot et dispose d'un outil repérant les documents multipage et détectant automatiquement la fin d'un document. Cela évite à l'utilisateur d'avoir à procéder à des combinaisons ou des séparations de PDF.

Sur le plan de la reconnaissance des caractères, il intègre une technologie de correction 3D qui promet une conversion extrêmement précise, même pour des images de basse qualité. Et, contrairement à la majorité des logiciels OCR, il n'y a pas besoin de renseigner les différents langages des documents à convertir, la détection est automatique.

Enfin, on apprécie le fait que OmniPage Standard soit connecté à plusieurs services cloud (Dropbox, Evernote, GoogleDocs, etc.) et qu'il permette de convertir directement les documents stockés par ces services. OmniPage Standard fonctionne sous Windows et est proposé à 69 euros.

La précision de la reconnaissance des caractères d’OmniPage Standard est remarquable grâce à son outil de correction 3D. © Nuance Communications
Abonnez-vous à la lettre d'information La question de la semaine : notre réponse à une question que vous vous posez, forcément.

!

Merci pour votre inscription.
Heureux de vous compter parmi nos lecteurs !

Cela vous intéressera aussi