Tesseract 4 - Programa OCR (Optical Character Recognition)

Post Reply
Message
Author
tenochslb

Tesseract 4 - Programa OCR (Optical Character Recognition)

#1 Post by tenochslb »

Este programa identifica texto en archivos .jpeg y lo transcribe a formato .txt

su uso basico es el siguiente:

Code: Select all

tesseract archivo.jpeg nombre -l spa+spa_old

Donde:
  • archivo.jpeg = el archivo que se quiere transcribir a formato texto
    nombre = el nombre que se le desee dar al archivo texto que sera creado
    -l = lenguage
    spa = diccionario español
    spa_old = diccionario español old
    + = para agregar mas de un diccionario
La descarga consiste en tres paquetes: Image
Attachments
sample3.png
Ejemplo de un archivo de texto generado a partir de una imagen por el software tesseract
(235.88 KiB) Downloaded 260 times

Post Reply