Linux : Faites le ménage dans vos fichiers

À force de sauvegarder, déplacer, renommer et supprimer les fichiers, on en arrive souvent à se voir naviguer entre dossiers vides, doublons et liens symboliques cassés. Pour éviter que votre ordinateur ne devienne la Foir’Fouille, FSlint est votre ami.

Installation et utilisation
Ce soft s’installe via votre gestionnaire de paquet favori. Exemple pour Debian/Ubuntu :

sudo apt-get install fslint

Il permet (entre autres) de supprimer les doublons, les fichiers temporaires, ceux qui se disent binaires sans l’être et les dossiers vides. La force de ce paquet en ce qui concerne la détection des doublons est qu’il n’utilise pas le nom mais la taille et la somme de contrôle des fichiers.

Son utilisation est très simple : on précise au programme quel dossiers on veux scanner et quels types de fichiers erronés on cherche.

Aperçu de l'interface de FSlint

Pour les doublons, FSlint nous indique les emplacements de tous les fichiers, donc il faut lui préciser lesquels de chaque doublon il faut supprimer. Pour cela, on peut sélectionner/désélectionner les fichiers via le bouton [sélectionné], qui propose par exemple de ne garder que le fichier le plus récent de chaque groupe.

Evitez les mauvaise surprises
Par défaut, les dossiers cachés sont inclus dans l’analyse, donc attention à ne pas supprimer vos fichiers de configuration (bien qu’ils ne seraient pas perdu, vu qu’ils étaient au moins en double…).

Pour éviter cela, aller dans l’onglet « paramètres avancés de recherche » où on peut exclure des dossiers. FSlint utilisant la commande find, on peut passer des arguments supplémentaires pour restreindre ou étendre la recherche. Comme ici on veut exclure les dossiers cachés, on ajoute dans les paramètres additionnels :

! -path '*/.*'

Bon nettoyage !

Linux  : Faites le ménage dans vos fichiers
4 (80 %) 4 votes
  • Pingback: Visualisez l'utilisation de vos disques | Le Blog de DorianLe Blog de Dorian()

  • (Re)découvert ce jour grâce à toi. Merci !!

  • NY152

    Mouais et sur quels critères les doublons sont détectés ? Le nom ? La taille ? Si c’est sur un quelquonque checksum, il serait bon d’indiquer lequel !

    • L’algorithme [1] est le suivant :
      1. Recherche des fichiers ayant la même taille
      2. Parmi cette liste, les éventuels hard links sont supprimés
      3. Dans la liste restante, on compare les hashs md5
      4. S’il y a collision des hashs md5, un sha1 est enfin utilisé pour comparer les fichiers.

      Cette recherche progressive permet de minimiser les hashs à effectuer, donc gagner du temps sur le scan.

      [1] http://en.flossmanuals.net/fslint/ch004_duplicates/

    • L’algorithme de détection des doublons [1] est le suivant :
      1. Recherche des fichiers qui font exactement la même taille,
      2. Dans cette liste de doublons, on supprime les éventuels hard links,
      3. Dans la liste restante, on fait un premier hash md5 rapide des fichiers,
      4. S’il y a collision du premier hash, on refait un hash md5 complet
      5. S’il y a toujours collision md5, on fait un hash sha1.

      Cette recherche progressive limite le nombre de hashs à effectuer, très chronophages.

      [1] https://raw.githubusercontent.com/pixelb/fslint/master/doc/FAQ