Puppy Linux Discussion Forum Forum Index Puppy Linux Discussion Forum
Puppy HOME page : puppylinux.com
"THE" alternative forum : puppylinux.info
 
 FAQFAQ   SearchSearch   MemberlistMemberlist   UsergroupsUsergroups   RegisterRegister 
 ProfileProfile   Log in to check your private messagesLog in to check your private messages   Log inLog in 

The time now is Thu 21 Sep 2017, 06:24
All times are UTC - 4
 Forum index » House Training » Users ( For the regulars ) » Pour les francophones
ROC ?
Moderators: Béèm, darkerror05
Post new topic   Reply to topic View previous topic :: View next topic
Page 2 of 2 [22 Posts]   Goto page: Previous 1, 2
Author Message
Pelo


Joined: 10 Sep 2011
Posts: 12489
Location: Mer méditerrannée (1 kms°)

PostPosted: Tue 12 Sep 2017, 00:50    Post subject: mes travaux avec Puppy OCR.  

mes travaux avec Puppy OCR.
ROC : à voir, c'est une suggestion.
quel est le but : eviter de retaper un texte photographié pour gagner du temps. Si océriser va plus vite OK, si Océriser vous oblige à retaper les caractères bancales, vous allez vite renoncer.
Le plus rapide ? lire le texte à haute voix et vous enregistrer avec pRecord. et faites une video sur le sujet, avec des belles images.
Les pets sont fournis page 1. là j'ai des soucis avec la Puppy, plus de souris. Je vous laisse.
puppyocr.jpg
 Description   Textes anciens.
 Filesize   104.07 KB
 Viewed   95 Time(s)

puppyocr.jpg


_________________
Passenger Pelo ! don't ask him to repair the aircraft. Don't use him as a demining dog .... pleeease.
Back to top
View user's profile Send private message Yahoo Messenger 
Dorothée


Joined: 27 Nov 2012
Posts: 122

PostPosted: Fri 15 Sep 2017, 14:43    Post subject:  

Pelo, merci pour toutes tes recherches, tu es une mine d'infos!

J'ai corrigé une petite erreur dans mon post plus haut. Le nom du fichier langue en anglais est eng.traineddata et non en.traineddata. Je continue mes essais.

Comme je l'ai écrit, la différence entre lepic2txt-batch et le pic2txt.pet (ou sfs) est que le premier permet de scanner d'un coup toutes les images d'un dossier, alors que le deuxième est une interface (gui) qui scanne les images une par une. Mais l'interface a un gros avantage, c'est que l'on peut changer le pourcentage - mais il ne faut pas oublier pour ça de monter imagechanger - et donc faire des essais (et ensuite modifier la taille de toutes les images en conséquence pour utiliser le batch?)

L'idéal serait d'inclure dans le script du batch la possibilité de changer la taille. Mais ça, je ne sais pas faire.

Tesseract a aussi une interface (gui), mais chez moi, pour une question que je n'ai pas résolue, ça ne marche pas.

PS: au fait, Pelo, puppyOCR est intéressant, mais il est basé sur.... tesseract.
Back to top
View user's profile Send private message 
Dorothée


Joined: 27 Nov 2012
Posts: 122

PostPosted: Fri 15 Sep 2017, 23:05    Post subject:  

Continuant mes recherches, j'ai trouvé comment redimensionner toutes les images d'un même dossier.

C'est avec imagemagick.

Voici la marche à suivre:

1) Monter imagemagick (en sfs ou le pet)

2) Mettre toutes les images dans un dossier

3) Ouvrir un terminal dans ce dossier (clic droit fenêtre terminal ici)

4) taper
Code:
mogrify -resize %requis *.tif (selon le format d'image)


exemple:
Code:
mogrify -resize 50% *.tif


ATTENTION: Si l'on s'arrête là, les images SONT REMPLACÉES PAR LES NOUVELLES.

Il faut donc donner le chemin d'un dossier de destination

exemple:
Code:
mogrify -resize 50% *.tif -path /root/images50pc/


(il y a aussi "convert" - voir la page ubuntu citée plus bas)
Cela m'a permis de résoudre mon problème. Je teste d'abord quel est le meilleur pourcentage de mes images pour la reconnaissance de caractère (avec Tesseract et l'interface pic2txt), ensuite je redimensionne les images avec imagemagick, et enfin je scanne le tout avec le batch pic2txt-batch (voir mon post au-dessus)

Un peu fastidieux certes, il y a sûrement mieux, mais efficace.

J'en profite pour faire la pub d'imagemagick, dont vous trouverez toutes les fonctions (impressionnantes!) ici: https://doc.ubuntu-fr.org/imagemagick
Tout est en ligne de commande, mais pour les anciens ouindozeurs comme moi, c'est un bon exercice.

À bientôt.
Back to top
View user's profile Send private message 
Pelo


Joined: 10 Sep 2011
Posts: 12489
Location: Mer méditerrannée (1 kms°)

PostPosted: Fri 15 Sep 2017, 23:57    Post subject: PuppyOCR est basé sur Tesseract  

Comme pas mal d'appications Puppy, PuppyOCR est basé sur Tesseract certes, mais en l'améliorant, en l'allégeant et en le rendant convivial.
Vous allez devoir linuxer pour adapter vos logiciels à votre Puppy. Alors que de braves gens l'ont déjà fait pour vous, avec Puppy OCR, dans le temps, quand ils étaient patients.
Mais ce sont des mots. Si vous voulez pas l'essayer, vous saurez jamais.
Pas mal de linuxiens ne veulent pas de Puppy, trop petit, pas assez cher, mon fils. Mais vous , Mais toi, DOOroothée ?

_________________
Passenger Pelo ! don't ask him to repair the aircraft. Don't use him as a demining dog .... pleeease.
Back to top
View user's profile Send private message Yahoo Messenger 
Dorothée


Joined: 27 Nov 2012
Posts: 122

PostPosted: Sat 16 Sep 2017, 01:48    Post subject:  

Tu as raison Pelo, c'est mieux quand on trouve des applications clé en main. Mais en matière de Puppy, ou linux, ça ne marche pas toujours comme sur des roulettes. En ce qui me concerne, j'ai des applications-phares, qui tournent toutes seules, et puis de temps en temps, je bidouille. Ça aiguise ma curiosité, me fait apprendre un peu, c'est sympa.

Quant à Puppy, l'essayer, c'est l'adopter!
Back to top
View user's profile Send private message 
augras

Joined: 11 Nov 2013
Posts: 1425
Location: france

PostPosted: Sat 16 Sep 2017, 04:58    Post subject:  

Dorothée wrote:
Continuant mes recherches, j'ai trouvé comment redimensionner toutes les images d'un même dossier.


Bonjour Dorothée,
Il y a beaucoup plus simple en utilisant Peasyscale de l'ami rcrsn51 : http://www.murga-linux.com/puppy/viewtopic.php?p=617584
C'est tout simplement... hyper simple et efficace, image par image ou bien dossier complet.
Pour l'ocr je n'y connais rien.
Philippe
Back to top
View user's profile Send private message 
Dorothée


Joined: 27 Nov 2012
Posts: 122

PostPosted: Sat 16 Sep 2017, 05:34    Post subject:  

Augras, merci pour le tuyau, d'autant que peasyscale est déjà installé sur Precise (ou en tout cas Triton).

C'est très pratique, c'est vrai. Le seul hic, c'est que la version que j'ai n'a l'air de traiter que les jpg, et que l'ocr se fait avec des images au format tif. Il faut que je l'actualise.

On avance, on avance...
Back to top
View user's profile Send private message 
Display posts from previous:   Sort by:   
Page 2 of 2 [22 Posts]   Goto page: Previous 1, 2
Post new topic   Reply to topic View previous topic :: View next topic
 Forum index » House Training » Users ( For the regulars ) » Pour les francophones
Jump to:  

You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum
You cannot attach files in this forum
You can download files in this forum


Powered by phpBB © 2001, 2005 phpBB Group
[ Time: 0.0960s ][ Queries: 15 (0.0116s) ][ GZIP on ]