Tech

Reconnaissance optique des caractères

DéfinitionClassé sous :informatique , reconnaissance optique des caractères , OCR
Le Newton MessagePad 100, d'Apple, sorti en 1993, intégrait une reconnaissance optique de caractères, que l'on écrivait sur l'écran tactile à l'aide d'un stylet. © Rama/Musée Bolo

Un système de reconnaissance optique des caractères analyse optiquement un texte et en produit une version informatique, sous forme d'un fichier texte, comme s'il avait été tapé sur un ordinateur. On utilise également l'acronyme OCR du terme anglais Optical Character Recognition.

Fonctionnement de l'OCR

La saisie optique peut être réalisée sur un scanner d'ordinateur lorsqu'il s'agit d'un texte imprimé. Cela peut être une image numérique d'origine quelconque. Enfin, l'OCR sert également à reconnaître en temps réel des caractères écrits sur un écran tactile.

La plupart des logiciels d'OCR actuels connaissent déjà un grand nombre de polices de caractères mais peuvent aussi procéder par apprentissage. La reconnaissance de textes manuscrits et écrits de manière naturelle avec des caractères liés entre eux reste encore un défi. Le logiciel doit aussi savoir se repérer dans une page de journal et s'en tenir au texte concerné, en repérant les lignes et en ignorant les autres articles, les légendes des photos ou les encarts publicitaires.

Cela vous intéressera aussi