Accueil  
Contact Plan du site
logo PBL
     
 

Dossier tech :
GED




introduction

règles catalo-graphiques

indexation matières

analyse par facettes

SYNTOL

codification et notation

indexation alphabétique matières

indexation automatique

PRECIS

thésaurus

recherche dans un index

indexation et intelligence artificielle

indexation sélective «intelligente»

 
     
     
 

8. La recherche dans un index


Un bon index présente une structure intellectuelle complexe, et une certaine maîtrise est essentielle pour toute recherche, si simple qu'elle ait d'abord paru. Il faut concevoir une «stratégie de recherche» qui conduise le plus efficacement, donc le plus économiquement, jusqu'à l'information requise. Quand on consulte un fichier informatisé, cet itinéraire est celui qui correspond au temps de connexion le plus court.

Même les index par auteurs posent des problèmes. Un auteur peut avoir pris des pseudonymes, avoir écrit sous plusieurs noms, avoir publié en collaboration comme coauteur. Les institutions produisent des documents dont elles sont auteur collectif, sans nom de personne. Certains documents ne portent pas de nom d'auteur et sont catalogués comme «anonymes». Toute stratégie de consultation exige donc qu'on connaisse d'abord bien les principes selon lesquels l'index a été conçu, c'est-à-dire le système des entrées et des renvois. Cela implique qu'on sache de quelle manière l'entrée figurant dans l'index désigne le document indexé et, bien qu'il existe un grand nombre de normes régissant ce genre de détails, aucun, pour l'instant, n'est universellement admis.

Celui qui consulte un index matières a tout particulièrement besoin d'une stratégie de recherche. Dans une première étape, il procédera à une analyse précise afin d'identifier le sujet de sa recherche, par exemple en utilisant un ensemble de termes empruntés à des catégories qui s'excluent les unes les autres, comme c'est le cas dans l'analyse par facettes: objets, parties, propriétés, processus, etc. Lorsque les termes d'un index sont choisis dans une liste ou un thesaurus, il faut consulter cette source afin de savoir quels termes l'index utilise pour désigner le sujet recherché. La plupart des chercheurs commencent par énoncer leur sujet de façon très générale, bien que ce ne soit pas la meilleure manière de procéder. Dans des index imprimés comme l'étaient ceux du C.N.R.S., on peut, en cherchant un terme trop général, passer à côté de documents qui sont indexés par des descripteurs plus spécifiques. Dans un index informatisé (PASCAL et MYRIADE pour le C.N.R.S.), si on utilise un terme trop large, on se voit livrer un nombre de références tel qu'on ne pourra pas les exploiter en temps réel, si ce n'est à un coût prohibitif. Il faut donc ajouter des termes au descripteur choisi pour le rendre plus spécifique. Cela sera facilité par une analyse initiale détaillée du sujet. La plupart des fichiers informatisés se prêtent à des recherches qui s'inspirent de la logique de Boole à laquelle elles empruntent les relations AND, OR et NOT (ET, OU et SAUF).

-  Terme A OU terme B: affiche sur l'écran les références qui contiennent soit l'un, soit l'autre terme; il s'agit là de l'étape la plus générale de la recherche.
-  Terme A SAUF terme B: affiche les références qui contiennent le premier terme, mais pas le second; on a là quelque chose de plus spécifique mais qui inclura encore les termes C, D, E, etc.
-  Terme A ET terme B: affiche les références qui contiennent les deux termes à la fois; étape plus spécifique elle aussi, qui peut produire des références moins nombreuses que ne fait la relation SAUF.
-  Terme A ET terme B SAUF C SAUF D...: affiche les références qui contiennent A et B, à l'exclusion des autres termes; c'est la recherche la plus spécifique, mais ce n'est pas toujours la plus féconde.

La recherche ayant été élargie ou rétrécie au point de fournir un nombre raisonnable de références ou «coups au but», l'étape suivante consiste à consulter les références elles-mêmes, ou des résumés s'il y en a. L'ordinateur peut afficher sur l'écran les trois ou quatre premières références, ce qui suffira à remplir l'écran et à montrer si la question posée a été formulée comme il convient. Le chercheur pourra alors demander une copie imprimée de l'ensemble des références fournies et aller dans une bibliothèque consulter les documents. Si la formulation se révèle incorrecte, il faut recommencer la recherche, ce qui démontre à quel point il est précieux de maîtriser convenablement cette technique.
Haut de page

 
  Thesaurus