Les logiciels de reconnaissance de caractères, appelés logiciels d’OCR pour Optical Character Recognition, permettent de récupérer le texte contenu dans une image et de le sauvegarder dans un fichier texte. Cela évite de recopier le texte d’une image, d’un pdf ou même d’une feuille en la scannant au préalable.
OCR gratuits en ligne
Il existe de tels logiciels en ligne, dont certains sont gratuits dans une certaine limite d’utilisation :
- ABBYY Finreader Online permet de transformer gratuitement 10 pages par jour.
- OCR Terminal permet de transformer gratuitement 20 pages par mois.
La limite de OCR Terminal est donc plus restrictive, cependant il a l’avantage d’accepter le format pdf en entrée, ce qui n’est pas le cas d’ABBYY Finreader.
Astuce pour transformer un .pdf en .doc avec un OCR qui n’accepte pas le format pdf en entrée
Si vous possédez un logiciel de reconnaissance de caractères qui n’accepte pas le format pdf en entrée ou que vous avez atteint la limite d’OCR Terminal, il faut transformer le document pdf en image au préalable. Pour cela :
- Vous pouvez faire des captures d’écran.
- Si vous souhaitez transformer tout une page, le mieux est d’utiliser PDFCreator. Ce logiciel libre et gratuit dont la fonction principale est de transformer les documents en .pdf peut également transformer un .pdf en .jpg ou autre format d’image.
Articles liés
- Une signature HTML sur Gmail
- Des outils pour bien choisir ses couleurs et tester le contraste de ses pages web
- Réalisez vos Storyboards en ligne avec HotGloo
C’est pratique ce logiciel, tu sais si c’est assez fiable au niveau de la retranscription du français de l’image vers le texte?
@stelyst: J’ai été agréablement surprise par la qualité de la retranscription en français. J’ai fait des tests du style transformer un .doc en .jpg puis le soumettre à la reconnaissance de caractères et le résultat était quasi identique au document de départ, sans une seule faute. Il faut cependant que l’image soit de bonne qualité. Inutile de tenter de scanner un document peu net.
Est ce que l’OCR respecte la mise en page originale du texte?
@Email: Autant que possible… ça rend pas mal.