Classification des documents

Quelques notes rapides sur la manière de classer les documents dans un système de fichiers.

Classification simple

Structure hiérarchique des dossiers

Une première option de classification consiste à construire une arborescence de répertoire en fonction du critère choisi. si l'on souhaite par exemple classer des documents par date, nous pouvons envisager une arborescence du type année/mois/ :

  • 2008
    • 01
      • texte1
      • texte2
    • 02
      • texte3
      • texte4
Classification des documents en fonction de la date de création.

Si la classification se fait par thème, il est nécessaire de structurer un vocabulaire puis de ranger les documents selon les règles définies, comme par exemple /thème/sous-thème :

  • sciences
    • astronomie
      • texte1
      • texte2
    • biolgie
      • texte3
      • texte4
Classification des documents en fonction du thème principal.

C'est la technique la plus simple, la plus couramment utilisée, de manière consciente ou inconsciente, et qui répond aux besoins dans la plupart des cas. Elle reste néanmoins limitée quand la classification exige une plus grande précision.

1.2. Un même document en différents points de la classification

Une première limite peut apparaître lorsque l'on souhaite avoir un document en différents points de l'arborescence. Si l'on reprend la classification thématique, on peut imaginer des documents portant plusieurs thèmes principaux. Nous pourrons encore gérer le problème en utilisant des liens symboliques :

  • sciences
    • astronomie
      • texte1
      • texte2
    • biolgie
      • texte1 -> sciences/astronomie/texte1
      • texte3
      • texte4
Classification des documents en fonction du thème principal. Le document texte1 classé dans « biologie » est un lien symbolique pointant vers le doucments placé dans « astronomie ».

Classifications multiples

Imaginons maintenant que l'on souhaite combiner les 2 hiérarchies décrites ci-dessus, ranger nos documents à la fois en fonction de leur thème et de leur date de création/publication. Quelles peuvent être les solutions ?

Imbrication de classification par dossier

On pourrait par exemple garder une hiérarchie comme hiérarchie de base et développer l'autre en tant que sous-hiérarchie. Par exemple :

  • sciences
    • astronomie
      • 2008
        • 01
          • texte1
          • texte2
    • biologie
      • 2008
        • 02
          • texte3
          • texte4
Classification selon une hiérarchie principale puis selon une seconde hiérarchie.

Le système deviendrait vite compliqué et inutilement lourd, surtout si l'on envisage un troisième voire un quatrième mode de classification. Et puis on diluerait l'information de la sous-hiérarchisation en différents points du système.

Utilisation de liens symboliques

Tout comme on peut utiliser les liens symboliques pour avoir un même document en différents points d'une classification, on peut étendre le principe avec des hiérarchies différentes :

  • sciences
    • astronomie
      • texte1
      • texte2
    • biolgie
      • texte3
      • texte4
  • 2008
    • 01
      • texte1 -> sciences/astronomie/texte1
      • texte2 -> sciences/astronomie/texte2
    • 02
      • texte3 -> sciences/biologie/texte3
      • texte4 -> sciences/biologie/texte4
Utilisation des liens symboliques pour classer les documents dans 2 hiérarchies différentes.

Il nous faudra toujours choisir une hiérarchisation principale, celle qui portera les documents « originaux », toutes les autres étant ensuite constituées de liens symboliques vers ces documents.