Chasse aux doublons avec Fslint

Post Reply
Message
Author
User avatar
Argolance
Posts: 3767
Joined: Sun 06 Jan 2008, 22:57
Location: PORT-BRILLET (Mayenne - France)
Contact:

Chasse aux doublons avec Fslint

#1 Post by Argolance »

Bonjour,
J'ai découvert Fslint par hasard alors que je cherchais un outil pour partir à la chasse aux doublons, et il se trouve qu'il est disponible (en français!) dans le dépôt Puppy Precise (version 2.42-2) via le Gestionnaire de Paquets, et sans doute aussi dans les autres dépôts. Il nécessite par ailleurs l'installation du paquet python-glade2_2.24.0-3, également disponible dans le dépôt ainsi que celle du paquet de développement devx.
FSlint est un utilitaire complet multifonctions permettant de nettoyer vos stockages de fichiers. Il s'agit d'une interface graphique écrite en pyGTK.

Résumé des fonctionnalités:
  • - Déduplication: la data déduplication est le fait de détecter les fichiers en double et de les lier entre eux au lieu de doubler la place utilisée par ceux-ci.
    - Nettoyage: permet de supprimer les fichiers temporaires.
    - Lien morts: permet de détecter et, si l'on veut, supprimer les liens morts.
    - Correction des extensions : détecter et corriger les extensions qui ne correspondent pas au type réel.
    - Suppression des dossiers vides.
    - Correction des noms avec plusieurs espaces de suite.
    - Renommage des fichiers utilisant des caractères incorrects (lettres non permises pour le nommages de fichiers comme /)
    - Stripping des binaires non strippés (suppression des données inutiles de débug des binaires, le stripping est déjà fait par défaut sur Ubuntu et Debian : sauf s'il y a une bonne raison, évitez d'y toucher)
    - Suppression de paquets (à éviter: ne fait pas toujours ce qu'il faut)
FSlint classe après la recherche les fichiers par ordre de place perdue par la duplication non nécessaire des données. Les fichiers les plus volumineux seront donc placés en tête de liste.
( :arrow: Source)
Étonnant que ce programme archi utile ne fasse pas partie de la panoplie obligée de Puppy...

[EDIT]: je m'aperçois après coup qu'il en est déjà question :arrow: ici et qu'il est proposé une version plus récente (2.44) que celle du dépôt.

Cordialement.
Last edited by Argolance on Sun 20 Jan 2019, 11:38, edited 5 times in total.

User avatar
Argolance
Posts: 3767
Joined: Sun 06 Jan 2008, 22:57
Location: PORT-BRILLET (Mayenne - France)
Contact:

#2 Post by Argolance »

Voici la version 2.44 de FSlint en fichier sfs avec une ligne de code qui modifie la valeur "Categories" du fichier d'entrée de menu au premier lancement de l'application afin qu'elle soit prise en compte dans le MENU (une routine python semble-t-il, modifie automatiquement - intempestivement? - la valeur "categories" dudit fichier - ceci est mentionné dans le fil anglophone).
Quant au fichier pet, il semble perturber petget qui a un curieux comportement et refuse de terminer le processus d'installation proprement (petite fenêtre d'avertissement qui ne se ferme pas).
Le fichier de traduction française a été revu car il présentait pas mal d'incorrections.

Cordialement.
Attachments
190118_154515_730x567_easyshot.jpg
(70.5 KiB) Downloaded 168 times
fslint-2.44_all.sfs.gz
Supprimer l'extension .gz
(180 KiB) Downloaded 143 times
Last edited by Argolance on Sun 20 Jan 2019, 11:40, edited 1 time in total.

musher0
Posts: 14629
Joined: Mon 05 Jan 2009, 00:54
Location: Gatineau (Qc), Canada

#3 Post by musher0 »

Salut, Argolance.

Oui-oui, par ici les doublons ! :D

Ou même des écus d'argent,
je ne ferai pas le dédaigneux ! :lol:

(Désolé d'avoir cédé au jeu de
mots facile !) ;)
Attachments
Ecu_d'argent_de_Louis_XIII_le_Juste.jpg
(137.62 KiB) Downloaded 154 times
musher0
~~~~~~~~~~
"You want it darker? We kill the flame." (L. Cohen)

oui

#4 Post by oui »

ppm l'installe dans Dpup Stretch depuis les dépôts Debian SID sans broncher et démarre ensuite à partir de l'icône trouvée dans le menu filesystem

par contre, enquiquinant à cause de l'appellation différente du nom d'installation, par ex.:

Code: Select all

#fslint-gui /mnt/sda1
et il n'y a pas de manpage pour la version gui

il semble exister un sosie pour la ligne de commande (peut-être alors avec une manpage? car pour la ligne de cde, il faut connaître les codes...)

lancé sur mon disque dur (seulement la recherche de mauvais noms, mon disque dur n'a qu'une seule partition), on ne voit pas le progrès de l'action

User avatar
Argolance
Posts: 3767
Joined: Sun 06 Jan 2008, 22:57
Location: PORT-BRILLET (Mayenne - France)
Contact:

#5 Post by Argolance »

Bonsoir,
Effectivement, la commande:

Code: Select all

/chemin/vers/fslint-gui --help
ne donne rien, du moins la version 2.44 donnée sur le fil mentionné plus haut. Je ne sais pas ce qu'il en est de la version du PPM, qui n'a peut-être pas ce problème?
En revanche, :arrow: ce lien apporte toute l'aide voulue quant aux possibilités de ce programme.

Traduction rapide française DeepL.com/Translator
La maintenance des systèmes de fichiers peut être un véritable fardeau administratif. Avec le temps, vous pouvez commencer à obtenir plusieurs copies d'un même fichier, des liens logiciels qui pointent vers des fichiers qui n'existent plus, des fichiers temporaires qui traînent plus longtemps qu'ils ne devraient, et des binaires qui ont été installés et dont les informations de débogage n'ont pas été supprimées. fslint peut vous aider à trouver ces fichiers problématiques pour que vous puissiez nettoyer votre système de fichiers.
[...]
La fenêtre principale de fslint est montrée [ci-dessus]. La partie supérieure de la fenêtre vous permet de restreindre les chemins recherchés et de spécifier si fslint reviendra dans ces répertoires. L'onglet Paramètres de recherche avancée vous permet de définir les chemins à exclure ainsi que les paramètres supplémentaires à passer directement à l'invocation de la commande find. Par défaut, /tmp, .svn, CVS, .git, /dev, /sys et /proc sont inclus dans la liste des chemins à ignorer.

Le corps de la fenêtre contient un certain nombre d'onglets ordonnés verticalement, chacun d'eux définissant un test de bouloche particulier que vous pouvez exécuter. Vous devez vous rappeler de cliquer sur le bouton Rechercher pour relancer la recherche lorsque vous changez d'onglet de bouloches. Il peut s'agir d'un piège si vous avez déjà exécuté la recherche pendant l'affichage d'un onglet de charpie particulier, puis modifiez les onglets de charpie et attendez-vous à ce que les résultats de la recherche précédente aient eu un effet sur l'onglet courant.

L'onglet Dupliquer vous permet de savoir si vous avez plusieurs copies d'un fichier. La détection des doublons vérifie d'abord que deux fichiers ont la même taille, puis que les fichiers ne sont pas des liens durs, puis calcule le MD5 des deux fichiers pour voir s'ils sont identiques. Lorsqu'un ou plusieurs doublons d'un même fichier sont trouvés, pour chaque groupe de fichiers identiques, l'utilitaire affiche une ligne d'en-tête indiquant combien de doublons existent et combien d'octets sont perdus en stockant les copies multiples. Dans la capture d'écran ci-dessus, vous pouvez voir fslint montrant les résultats en double pour une petite collection de fichiers de test que j'ai créés. Lorsque vous sélectionnez un doublon, le menu contextuel vous permet d'ouvrir, de copier ou de renommer le fichier. fslint ouvre les fichiers avec xdg-open, vous devriez donc voir une application familière ouverte pour la plupart des types de fichiers courants.

Si vous avez l'onglet Paquets installés affiché et cliquez sur Rechercher, fslint vous montrera tous les paquets que vous avez installés sur votre machine. Il n'y a pas de menu contextuel pour les paquets affichés dans la liste des paquets installés. Si vous exécutez fslint en tant que root, vous pouvez cliquer sur le bouton supprimer pour supprimer les paquets sélectionnés.

L'onglet Bad names vous permet de trouver les fichiers dont le nom de fichier a un encodage UTF-8 invalide. L'onglet Chocs de noms vous permet de trouver tous les alias d'un fichier ou de plusieurs fichiers -- des fichiers qui portent le même nom mais sont situés dans des répertoires différents. Les alias d'un fichier comprendront tous les liens logiciels ou durs vers le fichier. Trouver des fichiers portant le même nom mais se trouvant dans des répertoires différents peut être pratique si vous prévoyez de copier des fichiers dans un seul répertoire ou sur un système de fichiers non sensible à la casse. Malheureusement, l'option -c de la ligne de commande trouve l'utilitaire, qui effectue la recherche de conflit de nom, n'est pas exposée à travers l'interface graphique, car avec l'option -c vous pouvez limiter la recherche à afficher uniquement les fichiers qui sont dans le même répertoire et qui ont le même nom de fichier qui ne diffèrent que dans le cas du nom. De tels fichiers causeront des problèmes lorsque vous les copiez dans des systèmes de fichiers non sensibles à la casse. Quiconque a copié une arborescence de répertoires dans une structure plate sur un lecteur flash appréciera la détection de conflit de noms dans fslint.

L'onglet Fichiers temporaires vous permet de trouver les fichiers temporaires qui ont été laissés sur place. Vous pouvez limiter la recherche aux seuls fichiers de base et spécifier le nombre de jours que doit avoir le fichier temporaire pour que fslint le signale. Normalement, fslint vérifie le nom du fichier pour détecter s'il s'agit d'un fichier temporaire -- comme les fichiers se terminant par ~,.swp,.v, ou.bak ou ceux commençant par le caractère #. Bien que le test du fichier de base corresponde aussi d'abord aux noms de fichiers, en vérifiant si le mot de base est contenu n'importe où dans le nom de fichier, il y a un test subséquent pour essayer de s'assurer que le fichier est bien un fichier de débogage de base.

L'onglet Mauvais liens symboliques vous permet de trouver des liens pendants (liens symboliques vers des fichiers dans lesquels le fichier auquel le lien est lié a été supprimé) ; des liens suspects, qui sont des liens absolus vers des chemins dans ou sous le répertoire contenant le lien ; des liens redondants (contenant par exemple "/./" ou "///") ; ou simplement trouver tous les liens absolus ou relatifs.

L'onglet Bad IDs vous permet de trouver des fichiers ou des répertoires dont l'ID utilisateur ou de groupe n'est pas connu de votre système. De tels fichiers peuvent exister sur des partages NFS ou lorsqu'une archive a été étendue et que vous n'avez pas les mêmes noms d'utilisateur et informations de groupe sur votre machine que la personne qui a créé l'archive.

L'onglet Répertoires vides résume sa propre fonctionnalité. La recherche d'espaces redondants vous permet de trouver les fichiers qui ne sont pas correctement indentés ou qui contiennent des espaces blancs à la fin des lignes.

L'onglet Binaires non strippés vous permet de rechercher les chemins que vous avez nommés ou les répertoires de votre $PATH à la recherche de fichiers exécutables qui n'ont pas été dépouillés de leurs informations de débogage. Bien que vous aimeriez peut-être avoir des binaires contenant des informations de débogage si vous développez une application, vous pouvez économiser de la RAM et obtenir des temps de démarrage plus rapides si vous enlevez les informations de débogage de vos binaires.

fslint fournit également un utilitaire en ligne de commande qui correspond à chacun des onglets lint.

Trouver les fichiers en double et ceux qui ont de mauvais identifiants d'utilisateur et de groupe peut vous aider à nettoyer la bouloche de votre système de fichiers. La détection des liens défectueux va de la détection des liens pendants généralement utile jusqu'au cas plus perfectionniste de la recherche de liens qui incluent des parties redondantes dans leur définition.
Cordialement.

User avatar
Dorothée
Posts: 259
Joined: Tue 27 Nov 2012, 21:03

#6 Post by Dorothée »

Merci Argolance pour cet outil que je ne connaissais pas.

Post Reply