Puppy Linux Discussion Forum Forum Index Puppy Linux Discussion Forum
Puppy HOME page : puppylinux.com
"THE" alternative forum : puppylinux.info
 
 FAQFAQ   SearchSearch   MemberlistMemberlist   UsergroupsUsergroups   RegisterRegister 
 ProfileProfile   Log in to check your private messagesLog in to check your private messages   Log inLog in 

The time now is Sun 22 Oct 2017, 11:51
All times are UTC - 4
 Forum index » House Training » Users ( For the regulars ) » Pour les francophones
OCR
Moderators: Béèm, darkerror05
Post new topic   Reply to topic View previous topic :: View next topic
Page 2 of 4 [48 Posts]   Goto page: Previous 1, 2, 3, 4 Next
Author Message
Pelo

Joined: 10 Sep 2011
Posts: 12591
Location: Mer méditerrannée (1 kms°)

PostPosted: Tue 12 Sep 2017, 00:50    Post subject: mes travaux avec Puppy OCR.  

mes travaux avec Puppy OCR.
ROC : à voir, c'est une suggestion.
quel est le but : eviter de retaper un texte photographié pour gagner du temps. Si océriser va plus vite OK, si Océriser vous oblige à retaper les caractères bancales, vous allez vite renoncer.
Le plus rapide ? lire le texte à haute voix et vous enregistrer avec pRecord. et faites une video sur le sujet, avec des belles images.
Les pets sont fournis page 1. là j'ai des soucis avec la Puppy, plus de souris. Je vous laisse.
puppyocr.jpg
 Description   Textes anciens.
 Filesize   104.07 KB
 Viewed   231 Time(s)

puppyocr.jpg


_________________
Passenger Pelo ! don't ask him to repair the aircraft. Don't use him as a demining dog .... pleeease.
Back to top
View user's profile Send private message Yahoo Messenger 
Dorothée


Joined: 27 Nov 2012
Posts: 142

PostPosted: Fri 15 Sep 2017, 14:43    Post subject:  

Pelo, merci pour toutes tes recherches, tu es une mine d'infos!

J'ai corrigé une petite erreur dans mon post plus haut. Le nom du fichier langue en anglais est eng.traineddata et non en.traineddata. Je continue mes essais.

Comme je l'ai écrit, la différence entre lepic2txt-batch et le pic2txt.pet (ou sfs) est que le premier permet de scanner d'un coup toutes les images d'un dossier, alors que le deuxième est une interface (gui) qui scanne les images une par une. Mais l'interface a un gros avantage, c'est que l'on peut changer le pourcentage - mais il ne faut pas oublier pour ça de monter imagechanger - et donc faire des essais (et ensuite modifier la taille de toutes les images en conséquence pour utiliser le batch?)

L'idéal serait d'inclure dans le script du batch la possibilité de changer la taille. Mais ça, je ne sais pas faire.

Tesseract a aussi une interface (gui), mais chez moi, pour une question que je n'ai pas résolue, ça ne marche pas.

PS: au fait, Pelo, puppyOCR est intéressant, mais il est basé sur.... tesseract.
Back to top
View user's profile Send private message 
Dorothée


Joined: 27 Nov 2012
Posts: 142

PostPosted: Fri 15 Sep 2017, 23:05    Post subject:  

Continuant mes recherches, j'ai trouvé comment redimensionner toutes les images d'un même dossier.

C'est avec imagemagick.

Voici la marche à suivre:

1) Monter imagemagick (en sfs ou le pet)

2) Mettre toutes les images dans un dossier

3) Ouvrir un terminal dans ce dossier (clic droit fenêtre terminal ici)

4) taper
Code:
mogrify -resize %requis *.tif (selon le format d'image)


exemple:
Code:
mogrify -resize 50% *.tif


ATTENTION: Si l'on s'arrête là, les images SONT REMPLACÉES PAR LES NOUVELLES.

Il faut donc donner le chemin d'un dossier de destination

exemple:
Code:
mogrify -resize 50% *.tif -path /root/images50pc/


(il y a aussi "convert" - voir la page ubuntu citée plus bas)
Cela m'a permis de résoudre mon problème. Je teste d'abord quel est le meilleur pourcentage de mes images pour la reconnaissance de caractère (avec Tesseract et l'interface pic2txt), ensuite je redimensionne les images avec imagemagick, et enfin je scanne le tout avec le batch pic2txt-batch (voir mon post au-dessus)

Un peu fastidieux certes, il y a sûrement mieux, mais efficace.

J'en profite pour faire la pub d'imagemagick, dont vous trouverez toutes les fonctions (impressionnantes!) ici: https://doc.ubuntu-fr.org/imagemagick
Tout est en ligne de commande, mais pour les anciens ouindozeurs comme moi, c'est un bon exercice.

À bientôt.
Back to top
View user's profile Send private message 
Pelo

Joined: 10 Sep 2011
Posts: 12591
Location: Mer méditerrannée (1 kms°)

PostPosted: Fri 15 Sep 2017, 23:57    Post subject: PuppyOCR est basé sur Tesseract  

Comme pas mal d'appications Puppy, PuppyOCR est basé sur Tesseract certes, mais en l'améliorant, en l'allégeant et en le rendant convivial.
Vous allez devoir linuxer pour adapter vos logiciels à votre Puppy. Alors que de braves gens l'ont déjà fait pour vous, avec Puppy OCR, dans le temps, quand ils étaient patients.
Mais ce sont des mots. Si vous voulez pas l'essayer, vous saurez jamais.
Pas mal de linuxiens ne veulent pas de Puppy, trop petit, pas assez cher, mon fils. Mais vous , Mais toi, DOOroothée ?

_________________
Passenger Pelo ! don't ask him to repair the aircraft. Don't use him as a demining dog .... pleeease.
Back to top
View user's profile Send private message Yahoo Messenger 
Dorothée


Joined: 27 Nov 2012
Posts: 142

PostPosted: Sat 16 Sep 2017, 01:48    Post subject:  

Tu as raison Pelo, c'est mieux quand on trouve des applications clé en main. Mais en matière de Puppy, ou linux, ça ne marche pas toujours comme sur des roulettes. En ce qui me concerne, j'ai des applications-phares, qui tournent toutes seules, et puis de temps en temps, je bidouille. Ça aiguise ma curiosité, me fait apprendre un peu, c'est sympa.

Quant à Puppy, l'essayer, c'est l'adopter!
Back to top
View user's profile Send private message 
augras

Joined: 11 Nov 2013
Posts: 1448
Location: france

PostPosted: Sat 16 Sep 2017, 04:58    Post subject:  

Dorothée wrote:
Continuant mes recherches, j'ai trouvé comment redimensionner toutes les images d'un même dossier.


Bonjour Dorothée,
Il y a beaucoup plus simple en utilisant Peasyscale de l'ami rcrsn51 : http://www.murga-linux.com/puppy/viewtopic.php?p=617584
C'est tout simplement... hyper simple et efficace, image par image ou bien dossier complet.
Pour l'ocr je n'y connais rien.
Philippe
Back to top
View user's profile Send private message 
Dorothée


Joined: 27 Nov 2012
Posts: 142

PostPosted: Sat 16 Sep 2017, 05:34    Post subject:  

Augras, merci pour le tuyau, d'autant que peasyscale est déjà installé sur Precise (ou en tout cas Triton).

C'est très pratique, c'est vrai. Le seul hic, c'est que la version que j'ai n'a l'air de traiter que les jpg, et que l'ocr se fait avec des images au format tif. Il faut que je l'actualise.

On avance, on avance...
Back to top
View user's profile Send private message 
Dorothée


Joined: 27 Nov 2012
Posts: 142

PostPosted: Fri 29 Sep 2017, 01:31    Post subject:  

Dans un post plus haut, j'ai commenté comment j'avais dribblé la restriction de langue du patch pic2txt-batch proposé par rscrnnn, en changeant fra.traineddata en eng.traineddata.

C'était évidemment du malabarisme, il y a plus simple et qui prête moins à confusion.

Si vous souhaitez utiliser pic2txt-batch en français (en mettant le fra.traineddata dans /usr/share/tessdata), il faut, après avoir décompacté pic2txt-batch.tar.gz dans /usr/bin/, ouvrir ce script et modifier la ligne 28 en remplaçant eng par fra.

Par contre, je ne sais pas comment faire pour gérer plusieurs langues.

À bientôt,
Back to top
View user's profile Send private message 
Argolance


Joined: 06 Jan 2008
Posts: 3019
Location: PORT-BRILLET (Mayenne - France)

PostPosted: Fri 29 Sep 2017, 17:10    Post subject:  

Bonsoir,
Arrow Est-ce que par hasard, ça peut vous être utile?

Cordialement.

_________________

Back to top
View user's profile Send private message Visit poster's website 
Dorothée


Joined: 27 Nov 2012
Posts: 142

PostPosted: Fri 29 Sep 2017, 18:24    Post subject:  

Merci,

je vais y faire un tour et rendre compte de mes expériences.

À bientôt,
Back to top
View user's profile Send private message 
Dorothée


Joined: 27 Nov 2012
Posts: 142

PostPosted: Fri 29 Sep 2017, 20:25    Post subject:  

Après plusieurs tentatives, j'ai décidément du mal avec les interfaces graphiques (gui), auxquelles il manque toujours des librairies.

Mais je commence à m'en sortir assez bien avec la ligne de commande, et pour mon travail actuel, cela me convient.

En changeant un peu de sujet, quelqu'un peut-il me dire comment lister les librairies manquantes d'un logiciel dans la console? J'ai noté cela quelque part, mais je ne sais plus où.

Merci d'avance, à bientôt,
Back to top
View user's profile Send private message 
Pelo

Joined: 10 Sep 2011
Posts: 12591
Location: Mer méditerrannée (1 kms°)

PostPosted: Fri 29 Sep 2017, 23:40    Post subject: ldd /usr/bin/osmo  

ldd le chemin du binaire
ldd /usr/bin/osmo
# ldd /usr/bin/osmo
linux-gate.so.1 => (0xffffe000)
libgtk-x11-2.0.so.0 => /usr/lib/libgtk-x11-2.0.so.0 (0xb731a000)
libgdk-x11-2.0.so.0 => /usr/lib/libgdk-x11-2.0.so.0 (0xb726b000)
libpangocairo-1.0.so.0 => /usr/lib/libpangocairo-1.0.so.0 (0xb725d000)
libgdk_pixbuf-2.0.so.0 => /usr/lib/libgdk_pixbuf-2.0.so.0 (0xb723c000)
libcairo.so.2 => /usr/lib/libcairo.so.2 (0xb7171000)
libpango-1.0.so.0 => /usr/lib/libpango-1.0.so.0 (0xb7127000)
libgobject-2.0.so.0 => /usr/lib/libgobject-2.0.so.0 (0xb70d9000)
.....

_________________
Passenger Pelo ! don't ask him to repair the aircraft. Don't use him as a demining dog .... pleeease.
Back to top
View user's profile Send private message Yahoo Messenger 
Dorothée


Joined: 27 Nov 2012
Posts: 142

PostPosted: Sat 30 Sep 2017, 01:06    Post subject:  

Merci Pelo,

au moins maintenant, je saurai ce qui manque. L'étape suivante sera de trouver ce qui manque...

À bientôt,
Back to top
View user's profile Send private message 
Argolance


Joined: 06 Jan 2008
Posts: 3019
Location: PORT-BRILLET (Mayenne - France)

PostPosted: Sat 30 Sep 2017, 06:58    Post subject:  

Bonjour,
Je viens de compiler "ocrgui" (lien donné plus haut) et fait un fichier SFS, installé ImageMagick et tesseract ainsi que ses dépendances via le PPM (ToOpPy basée, comme Triton 5.0, sur Puppy Precise 5.7.1).
Et ça marche nickel! Very Happy
Reste que l'interface est en anglais et que la seule langue disponible est l'italien, langue du concepteur Emanuele Sicchiero. Je vais donc faire la traduction et reviendrai rendre compte du résultat quand ce sera au point, car il y a des modifications à apporter ici et là pour que ça fonctionne, notamment le fichier desktop, sans quoi le programme n'apparait pas dans le MENU.

[EDIT]: Traduction effectuée!.

Cordialement.
170930_165938_866x697_easyshot.jpg
 Description   
 Filesize   77.56 KB
 Viewed   66 Time(s)

170930_165938_866x697_easyshot.jpg

170930_115609_804x686_easyshot.jpg
 Description   
 Filesize   94.94 KB
 Viewed   77 Time(s)

170930_115609_804x686_easyshot.jpg


_________________

Back to top
View user's profile Send private message Visit poster's website 
Dorothée


Joined: 27 Nov 2012
Posts: 142

PostPosted: Sat 30 Sep 2017, 22:38    Post subject:  

Argolance, tu es top!

J'attends ton sfs avec impatience. Une interface graphique qui marche, quel luxe!
Back to top
View user's profile Send private message 
Display posts from previous:   Sort by:   
Page 2 of 4 [48 Posts]   Goto page: Previous 1, 2, 3, 4 Next
Post new topic   Reply to topic View previous topic :: View next topic
 Forum index » House Training » Users ( For the regulars ) » Pour les francophones
Jump to:  

You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum
You cannot attach files in this forum
You can download files in this forum


Powered by phpBB © 2001, 2005 phpBB Group
[ Time: 0.0528s ][ Queries: 14 (0.0059s) ][ GZIP on ]