Reconnaissance de caractères : OCR gratuits en ligne

Publié le 30 septembre 2009 par Delphine Dietrich 5 commentaires »

Reconnaissance de caractères - OCRLes logiciels de reconnaissance de caractères, appelés logiciels d’OCR pour Optical Character Recognition, permettent de récupérer le texte contenu dans une image et de le sauvegarder dans un fichier texte. Cela évite de recopier le texte d’une image, d’un pdf ou même d’une feuille en la scannant au préalable.

 

22/06/2010 : une petite mise à jour de cet article pour y annoncer qu’un OCR est maintenant intégré à Google Docs !

OCR gratuits en ligne

Il existe de tels logiciels en ligne, dont certains sont gratuits dans une certaine limite d’utilisation :
- ABBYY Finreader Online permet de transformer gratuitement 10 pages par jour.
- OCR Terminal permet de transformer gratuitement 20 pages par mois. La limite de OCR Terminal est donc plus restrictive, cependant il a l’avantage d’accepter le format pdf en entrée, ce qui n’est pas le cas d’ABBYY Finreader.

Astuce pour transformer un .pdf en .doc avec un OCR qui n’accepte pas le format pdf en entrée

Si vous possédez un logiciel de reconnaissance de caractères qui n’accepte pas le format pdf en entrée ou que vous avez atteint la limite d’OCR Terminal, il faut transformer le document pdf en image au préalable. Pour cela :
- Vous pouvez faire des captures d’écran.
- Si vous souhaitez transformer tout une page, le mieux est d’utiliser PDFCreator. Ce logiciel libre et gratuit dont la fonction principale est de transformer les documents en .pdf peut également transformer un .pdf en .jpg ou autre format d’image.


Articles liés
Publicité

5 commentaires

  1. @stelyst: J’ai été agréablement surprise par la qualité de la retranscription en français. J’ai fait des tests du style transformer un .doc en .jpg puis le soumettre à la reconnaissance de caractères et le résultat était quasi identique au document de départ, sans une seule faute. Il faut cependant que l’image soit de bonne qualité. Inutile de tenter de scanner un document peu net.

  2. stelyst dit :

    C’est pratique ce logiciel, tu sais si c’est assez fiable au niveau de la retranscription du français de l’image vers le texte?

  3. Email dit :

    Est ce que l’OCR respecte la mise en page originale du texte?

  4. @Email: Autant que possible… ça rend pas mal.

  5. Anonyme dit :

    Je suis satisfait par la qualité de la retranscription en français.