| |
Le dossier actuel porte sur la complexité, dans le monde
de l'édition électronique et de la GED (Gestion électronique
de documents), de l'indexation des documents.
Introduction
1. Les règles catalographiques
2. L'indexation matières
3. L'analyse par facettes
4. SYNTOL
5. La codification et la notation
6. L'indexation alphabétique matières
7. L'indexation automatique
PRECIS
Thésaurus
8. La recherche dans un index
9. Indexation et intelligence artificielle
Genèse
des recherches en indexation automatique
Fonction
documentaire du texte et mots vides
La recherche
en texte intégral
L'indexation
sélective «intelligente»
Introduction
L'indexation consiste à identifier dans un document certains
éléments significatifs qui serviront de clé
pour retrouver ce document au sein d'une collection. Ces éléments
comprennent le nom de l'auteur, le titre de l'ouvrage, le nom de
l'éditeur, la date de publication et l'intitulé du
sujet traité. Des règles d'usage régissent
le choix et la forme des noms, les listes de vedettes matières,
les plans de classification et d'analyse documentaire. La programmation
et l'impression des index par ordinateur ont accru l'importance
de ces codes. La complexité des documents modernes et la
variété des formes sous lesquelles ils se présentent
exigent qu'on aborde de façon systématique la construction
des index et leur emploi.
Étymologiquement, indexer signifie montrer du doigt
quelque chose qu'on veut identifier à telle ou telle fin.
À l'époque moderne, on désigne par ce mot l'action
d'identifier tel ou tel aspect significatif de document quelle
qu'en soit la nature de façon que cet aspect ou ces aspects
servent de clés quand on aura besoin, plus tard, de le rechercher
au sein d'une mémoire. Pendant plusieurs siècles,
cela s'est appliqué aux livres; l'auteur ou l'éditeur
faisaient souvent suivre leur texte d'un index, et les bibliothécaires
fournissaient des clés sous forme de listes ou de catalogues
indiquant ce que contenaient leurs collections.
Notre société a vu se développer l'usage de
beaucoup d'autres types de documents, tels que le film sous ses
différentes formes, les bandes audio et vidéo, les
bandes et disques utilisés comme mémoire dans un ordinateur.
Tous ces documents contiennent de l'information, qu'il convient
d'étiqueter clairement afin que ceux qui désirent
la consulter puissent y accéder aisément.
On caractérise le plus clairement et le plus évidemment
un texte par le nom de l'auteur (ou des auteurs). Si, pour certaines
uvres anciennes, ce nom n'est pas toujours facile à
déterminer, en général, pour la plupart des
documents récents, il constitue le premier élément
d'information, car il est tout particulièrement commode à
identifier. En effet, la page de titre d'un livre donne le nom de
l'auteur, nom sous lequel celui-ci veut se faire connaître.
Cela est vrai même lorsqu'un document n'est pas l'uvre
d'une seule personne, mais d'une collectivité, une université
ou une société de droit privé par exemple.
Le titre que l'auteur donne à son uvre présente
les mêmes spécificités.
La date et le lieu de publication, l'édition, le nombre de
pages, la présence de cartes, de plans, de tables et d'illustrations
sont des éléments importants qui aident à identifier
un document. Toutes ces caractéristiques sont faciles à
déterminer, et l'ensemble du processus porte le nom de catalogage.
La disposition des entrées au sein d'un fichier auteurs-titres
est relativement simple: noms propres et mots se suivent par ordre
alphabétique. Beaucoup de bibliothèques nationales,
dont la Bibliothèque nationale française, ont publié
des catalogues de leurs collections suivant l'ordre alphabétique
des noms d'auteurs, et Les Livres disponibles, le catalogue
des livres français disponibles chez les éditeurs,
comporte une partie alphabétique par auteurs et une autre
par titres, en ordre alphabétique.
Le problème de savoir comment choisir l'indexation matières
d'un document est beaucoup plus complexe; en général,
le titre ne fait guère plus que mettre en relief un ou deux
mots importants. On pourrait croire qu'un auteur est le mieux placé
pour concevoir l'index matières de son propre livre, mais
les éditeurs préfèrent souvent confier la préparation
de l'index à des indexeurs professionnels qui connaissent
parfaitement la théorie et la pratique de l'indexation matières
et de l'analyse documentaire ou de la classification.
La classification figure depuis longtemps parmi les outils fondamentaux
de la méthode scientifique. Ainsi, pour ordonner de façon
systématique l'ensemble des collections d'une bibliothèque,
il faut comprendre, en théorie et en pratique, comment sont
structurées les connaissances humaines et comment il convient
de grouper les documents afin de montrer les relations qu'il y a
entre leurs sujets, ce qui aide le lecteur à mieux comprendre
le classement et à mieux utiliser la collection. Les experts
se penchent depuis plusieurs siècles sur ces activités
complexes que sont le catalogage et la classification. Ils ont élaboré
un grand nombre de systèmes, de règles et de codes.

|
|