Les Techniques documentaires

(2002) - Thésaurus: l’achat possible

Archimag, 2002, n° 156, pp. 36-38

Vous devez organiser votre documentation, indexer les documents de votre fonds, penser à leur classement. Vos utilisateurs doivent pouvoir retrouver ce qu'ils recherchent dans un fonds documentaire multidisciplinaire ou spécialisé. Dois-je créer mon propre thésaurus ou m'inspirer d'un thésaurus existant ?. Question difficile car les thésaurus disponibles sur le marché sont le plus souvent des " produits-maison ", ou des thésaurus conçus par des institutions importantes, pouvant contenir plusieurs milliers de termes ne correspondant que partiellement à ce qui est recherché. Dans le cas des thésaurus spécialisés, ceux-ci sont très nombreux et le choix apparaît difficile.

Chaque structure documentaire est unique, et chaque utilisateur de cette structure est lui-même unique, avec des demandes particulières. La construction d'un thésaurus demande du temps et des moyens financiers: il fait appel à une technique particulière, il doit être réfléchi, avoir une hiérarchie rigoureuse, pouvoir être souple pour être mis à jour. Face à ces problèmes à résoudre, les documentalistes ont l'habitude, à juste raison, de se tourner vers le réseau professionnel et adopte souvent les mêmes règles: il peut en être de même pour le thésaurus. Si le thésaurus est adopté par un réseau documentaire ayant une même thématique, les avantages sont alors multiples au niveau des échanges et de la coopération: grâce à un thésaurus commun, l'indexation peut, par exemple, être partagée; la recherche documentaire est facilitée et l'accès à des fonds divers mais complémentaires est rendu possible.

Difficile de revenir en arrière

Une autre solution passe par le choix du langage documentaire le plus proche des besoins exprimés: l'offre en matière de thésaurus est large, mais demande une étude approfondie car une fois le choix effectué, il est difficile de revenir en arrière. Si le fonds documentaire est pluridisciplinaire, il existe des solutions " généralistes ": certains grands langages documentaires dits " encyclopédiques " comme le thésaurus de l'UNESCO peuvent être pris comme modèle de référence. Si le fonds est spécialisé, la difficulté réside dans le choix du " bon " thésaurus car l'offre est très diversifiée.

Afin de voir s'il existe un ou des thésaurus dans le domaine recherché, le moyen le plus simple est de savoir s'il est en vente. La banque de données commerciale française Electre (sur 36 17 Electre et sur abonnement  www.electre.com) propose un peu plus d'une soixantaine de thésaurus en vente dans de nombreux domaines: histoire, management, architecture, médecine, urbanisme, image... Le problème est qu'il faut acquérir le thésaurus avant de pouvoir le consulter et voir ainsi s'il correspond à ce que est recherché. Une possibilité est de s'adresser à un centre de documentation du même domaine afin de prendre conseil.

Des thésaurus sur Internet

A l'heure d'Internet, un certain nombre de thésaurus sont présents sur ce média; il est possible de les consulter directement en ligne, parfois de les télédécharger (gratuitement ou non): l'offre est cependant le plus souvent en anglais et pose donc quelques problèmes de traduction de termes. Mais les thésaurus en langue française se développent sur la Toile. Le site de la Bibliothèque nationale du Canada ( www.nlc-bnc.ca) propose des recueils de thésaurus classés par catégories (généralités; philosophie et psychologie; art; littérature; géographie et histoire). Le site de l'URFIST de Lyon signale une liste de thésaurus en ligne ( http://urfist.univ-lyon1.fr/gratuits/content36.html). D'autres sites (anglophones) possèdent des liens vers des thésaurus:

La construction d'un " thésaurus-maison " peut être d'un coût élevé (temps passé notamment). Les thésaurus en vente ont des tarifs très différents suivants l'organisme producteur, sa taille... Un certain nombre sont consultables sur Internet, mais ne peuvent être télédéchargés, à moins de signer un accord avec l'éditeur. Les prix sont donc variables: aux alentours de 75 euros jusqu'à 685 euros pour le thésaurus Delphes (sur disquette avec intégration dans la base de données interne). Ce coût doit donc être prévu et inclus dans un budget documentaire.

Quelques exemples de thésaurus

Il existe des thésaurus incontournables à l'heure actuelle: de par l'institution qui les produit, de par leur thématique très générale. S'inspirer de ces thésaurus est une possibilité offerte à tout professionnel. Il peut adopter une partie du thésaurus choisi et construire son propre thésaurus à partir d'une base solide.

Le thésaurus de l'UNESCO

  • Producteur: l'UNESCO est l'organisation des Nations-Unies pour l'éducation, les sciences et la culture.
  • Date de création: 1977, avec une deuxième édition en 1995.
  • Domaines couverts: éducation, sciences, culture, sciences humaines et sociales, information et communication, droit, économie et politique
  • Langues: Français-Anglais-Espagnol
  • Diffuseur: l'UNESCO. Version papier (en vente à la librairie de l'Unesco, place de Fontenoy, 75007, Paris); en ligne; sur cédéroms (incluant les bases de données de l'Unesco); sur Internet ( www.ulcc.ac.uk/unesco/)
  • Avantages: l'intérêt majeur de ce thésaurus est qu'il propose des descripteurs dans plusieurs langues et qu'il est multidisciplinaire. Il inclut également les noms de pays, ainsi que les groupes linguistiques ou ethniques.
  • Inconvénients: ils découlent des avantages décrits. C'est un thésaurus très complet, mais très lourd à manier, avec plusieurs milliers de termes.

Le thésaurus ERIC

  • Producteur: National Library of Education (Etats-Unis)
  • Date de création: 1966
  • Domaines couverts: sciences de l'éducation, sciences humaines
  • Langue: Anglais
  • Diffuseur: interrogeable en ligne à partir de:  http://searcheric.org
  • Avantages: le thésaurus ERIC est constitué de plus de 10 000 termes et de plus de 66 000 relations entre eux. C'est un des plus complet dans le domaine de l'éducation. ERIC (Educational Resources Information Center) est une base de données produite par la National Library of Education. Le thésaurus ERIC sert à indexer les documents de la base de données ERIC.
  • Inconvénients: il couvre une réalité américaine; les indexeurs français ont parfois du mal à trouver les équivalences en français.

Le thésaurus MOTBIS

  • Producteur: Centre national de documentation pédagogique (Paris)
  • Domaine couvert: sciences de l'éducation
  • Langue: Français
  • Diffuseur: Centre national de documentation pédagogique (Paris)
  • Avantages: très complet avec plus de 9000 termes, le thésaurus MOTBIS est utilisé dans la plupart des bibliothèques et centre de documentation dépendant de l'Education nationale, ainsi que dans les Universités, le CNDP et les CRDP. Ils sert également à indexer le site du Centre national de documentation pédagogique Educasource ( www.educasource.education.fr). MOTBIS (version 3.1) est consultable sur:  http://www2.ac-rennes.fr/barde/HTML/SuperDoc/ motbis31/motbis31.htm
  • Inconvénients: la version papier compte quatre volumes. Il est donc très complet, mais également difficile à adopter dans son ensemble pour une petite structure documentaire.

Le thésaurus Delphes

  • Producteur: Chambre de commerce et d'industrie de Paris (CCIP)
  • Date de création: 1980
  • Langue: Français
  • Domaines couverts: économie, monde de l'entreprise, de la finance et des marchés d'exportation français et internationaux
  • Diffuseur: la société Indexpresse à Grenoble diffuse le cédérom Delphes, base de données économique (Archives Delphes 1980-1996). Contact: delphes@indepresse.fr Le thésaurus est intégré au cédérom. Le thésaurus Delphes (dernière mise à jour version 2000) est consultable en ligne sur:  www.infomediatheque.ccip.fr/ccipdie/ produits/thesaurus.htm
  • Avantages: Delphes est un des thésaurus les plus connus et les plus utilisés dans le domaine économique par les centres de documentation des chambres de commerce françaises. Le nombre de descripteurs est de 5371 termes auxquels s'ajoutent 485 termes géographiques.
  • Inconvénients: la gestion de cet outil est nécessairement lourde pour un centre documentaire traitant, par exemple, une seule branche industrielle dont la production est destinée à un marché spécifique.
  • Autres thésaurus à signaler dans le domaine de l'économie: le thésaurus de la Commission des opérations de bourses (COB); des renseignements utiles sont donnés sur le domaine financier par les signets de la Bibliothèque nationale de France ( www.bnf.fr), le site du ministère des Finances ( www.finances.gouv.fr)

Le thésaurus MeSH (Medical Subject Headings)

  • Producteur: National Library of Medicine (Etats-Unis)
  • Date de création: 1966
  • Domaines couverts: médecine, biologie, santé
  • Langues: Anglais avec une traduction française
  • Diffuseur: la traduction française (F-MeSH) est diffusée par l'INSERM (Institut national de la santé et de la recherche médicale -  www.inserm.fr). La version américaine (4 volumes) peut être commandée par l'intermédiaire d'un libraire.
  • Avantages: le MeSH, thésaurus de la base de données américaine Medline (plus de 10 millions de références) est le thésaurus de référence en médecine, avec plus de 20742 descripteurs. Servant à indexer plus de 4300 revues médicales internationales, il est utilisé pour la recherche documentaire dans la majorité des bibliothèques et centres de documentation spécialisés en médecine de par le monde. De nombreux sites internet médicaux sont indexés avec le MeSH. Sur le site de l'Inserm, vous pouvez rechercher un terme dans la base de données du vocabulaire ou dans les index ou le thésaurus bilingue pour:
    • voir les informations et les relations concernant ce terme ou le situer dans son environnement hiérarchique,
    • rechercher directement les références bibliographiques correspondantes sur la base PubMed,
    • Vous pouvez aussi consulter les modifications du MeSH 2002 (termes nouveaux, modifiés ou supprimés) et les listes de descripteurs particuliers
  • Inconvénients: sa structure complexe nécessite un apprentissage sérieux et de nombreux utilisateurs peuvent être déconcertés. Vous pouvez consulter le thésaurus MeSH français / anglais sur le site de l'Inserm mais en aucun cas le télécharger. Pour cela, il faut en faire la demande et signer un contrat ou une convention de concession de droit d'utilisation auprès de l'Inserm.

Le thésaurus de l'Architecture

  • Producteur: direction de l'Architecture et du patrimoine - ministère de la Culture (France)
  • Domaines couverts: art, architecture, patrimoine
  • Langues: Français
  • Diffuseur: le thésaurus de l'Architecture permet d'interroger cinq bases de données à partir du site  www.culture.gouv.fr (Mérimée, Palissy, Archidoc, Mémoire, Thésaurus). Chaque base peut être interrogée indépendamment.
  • Avantages: le thésaurus de l'architecture développe sous une forme méthodique les 1135 termes utiles à la dénomination des oeuvres architecturales. Ces termes permettent l'indexation des ensembles, édifices et édicules, analysés dans la base de données sur le patrimoine français, la base nationale  Mérimée. L'organisation propre au thésaurus permet ainsi de situer chaque terme dans une hiérarchie dont les entrées principales sont classées selon des catégories fonctionnelles liées à l'usage religieux, funéraire, industriel, etc. Il comporte en outre tous les renvois nécessaires, des définitions sommaires, des notes d'utilisation
  • Inconvénients: si la plupart des thésaurus exposés ici comportent plusieurs milliers de termes, celui-ci semble parfois trop restreint par rapport à la thématique développée.
  • Autres thésaurus à signaler en art et en architecture: Art and Architecture Thesaurus (AAT); Getty Thesaurus of Geographic Names (TGN) interrogeables sur le site: href="http://www.getty.edu/research/tools/vocabulary/tgn/about.html" target="_blank">http://www.getty.edu/research/ tools/vocabulary/tgn/about.html

Le thésaurus de l'Eau

  • Producteur: ministère de l'Aménagement du territoire et de l'environnement - Office international de l'eau (France)
  • Domaines couverts: environnement, eau
  • Langue: multilingue, Français-Anglais-Espagnol
  • Diffuseur: sur papier en 3 volumes (53.36 euros) ou en format électronique pdf (106,71 euros) à partir du site:  http://www.oieau.fr/thesaurus.htm. Contact: eaudoc@oieau.fr
  • Avantages: thésaurus complet, présentant l'avantage d'être multilingue
  • Inconvénients: la mise à jour du thésaurus peut être un inconvénient à signaler.
  • Autres thésaurus dans le domaine de l'eau et de l'environnement à signaler: GEMET (General Multilingual Environmental Thesaurus) en 15 langues produit par l'Agence européenne de l'environnement, consultable sur:  http://www.mu.niedersachsen.de/ cds/etc-cds_neu/ library/Gemet.pdf ; ASFA (Aquatic sciences and aquatic abstracts) produit par Cambridge Scientific Abstracts et la FAO (Food and Agriculture Organisation) sur :  http://www4.fao.org/asfa/asfa_fr.htm; le thésaurus francophone du développement durable, produit par l'Ecole nationale supérieure des mines de Saint-Etienne sur:  http://www.agora21.org/relief/frame2.html

Quelques références indispensables

AITCHINSON J., GILCHRIST A. Construire un thésaurus: manuel pratique. Paris: ADBS, 1992.
AMAR M. Les fondements théoriques de l'indexation: une approche linguistique. Paris: ADBS, 2000.
BLANQUET M.-F. Intérêt pédagogique de l'apprentissage des langages documentaires. Paris: CNDP, 2001. [consulté le 25 avril 2001]. Disponible sur Internet:  http://savoirscdi.cndp.fr/CulturePro/ actualisation/linguistique/blanquet.htm, 5 p.
DEGEZ D. Notice Thésaurus. In Dictionnaire de l'information et de la documentation. Paris: Nathan, 1997. pp. 577-579 .
MANIEZ J. Actualité des langages documentaires. Les fondements théoriques de la recherche d'information. Paris: ADBS, 2002.
VAN SLYPE G. Les langages d'indexation: conception, construction et utilisation dans les systèmes documentaires. Paris: Editions d'Organisation, 1986.
Règles d'établissement des thésaurus monolingues, NF Z 47-100, 101, 103; ISO 2788.
Pour les thésaurus multilingues: ISO 5964.

cop. JP Accart, 2007

 

{

Abonnement

Recevez chaque mois par mail l’Edito et les mises à jour du site. Entrez votre adresse e-mail:

Nom:
Courriel: