OCR tesseract

Post Reply
Message
Author
User avatar
boxR
Posts: 338
Joined: Sat 13 Aug 2011, 21:58
Location: France

OCR tesseract

#1 Post by boxR »

Pour ceux que ça intéresse, il est possible de faire de la reconnaissance de caractères (OCR) avec Tesseract, comme expliqué sur ce fil du forum ASRI édu.
Commencer d'abord par installer Tesseract (le programme de reconnaissance lui-même).
Celui-ci peut ensuite être utilisé au choix dans Xsane ou bien indépendamment grâce à OcrGui.

Tesseract Xsane2Tess
  • 1) installer ImageMagick : ImageMagick-6.6.9-5.pet
    2) installer Xsane2Tess : xsane2tess-1.0_asri_20130102.pet
    3) dans xsane aller dans Préférences > Configuration > OCR et remplir le champ Commande OCR avec : xsane2tess -l fra
    4) utilisation :
    - scanner avec comme cible la Visionneuse
    - cliquer sur : Fichier > OCR - Sauver au format
OcrGui
  • 1) installer ImageMagick : ImageMagick-6.6.9-5.pet
    2) installer OcrGUI : ocrgui-0.2.2-i486.pet
    3) faire le réglage dans OcrGUI : File > Preferences > Spell check > Dictionary path and name : /usr/share/hunspell/fr_FR
    4) utilisation :
    - scanner en .tif exclusivement
    - traiter l'image si besoin avec un traitement d'image
    - faire la reconnaissance avec OcrGui qui permet de comparer l'image et le texte reconnu, avec l'aide du correcteur orthographique hunspell.
Vérification des md5 :
tesseract-3.00-i486.pet ........................ md5 : 301c411fb60d4faf5365318535027f70
tesseract-ocr-3.00.fra.pet .................... md5 : ec1d76f85bfce66f8318d30b90c6cf86
ImageMagick-6.6.9-5.pet ..................... md5 : 01ac3f278b5d2f221d529e75eaf31bf3
xsane2tess-1.0_asri_20130102.pet ..... md5 : cc91e3ed6a04712673dd8fe0032b299a
ocrgui-0.2.2-i486.pet ........................... md5 : 157d95bb4b7f267ff6edcf781665a3c2

Post Reply