Les Techniques documentaires

(1994) - Les banques de données: historique et production

Le Micro-Bulletin du CNRS, 1994, n° 56, pp. 104-111.

En complément de l'état de l'offre en matière de banques de données biomédicales (publié dans le précédent Micro Bulletin), Jean-Philippe Accart nous offre ici des explications plus méthodologiques qui devraient vous aider dans l'utilisation des banques de données que vous êtes (ou serez) amenés à consulter dans votre démarche de recherche d'information.

C'est cette même démarche de recherche d'information que vous effectuez en utilisant un logiciel de gestion bibliographique tel que Bibliodoc, dont nous reparlons dans ce numéro. Ce qui nous intéresse aujourd'hui, c'est l'évolution de ce logiciel et les améliorations qui y ont été apportées depuis la version précédente. Il nous a donc paru plus intéressant de laisser parler un utilisateur de cette nouvelle version après rappel des .fonctionnalités principales exposées par Bernard Lassalle dans le n° 47 de la revue, que nous republions ici en partie.

Un centre de documentation, une bibliothèque, aussi fournis soient-ils en documents papier et audiovisuels, ne peuvent tout posséder. L’important pour ces structures est également d'offrir à ses usagers le plus d'accès possibles à l'information. Il existe, depuis les années 70, de gigantesques réservoirs d'informations: les banques de données. Par rapport à la recherche traditionnelle d'information, la recherche informatisée donne la possibilité de repérer très rapidement l'information ou des références de documents, parfois même le texte intégral de l'information recherchée. Il est devenu très important pour les chercheurs de connaître ces sources de données potentielles, de savoir comment y accéder et d'avoir les moyens de les interroger.

Généralités sur les banques de données

L’information peut être considérée comme une nouvelle matière première, et notre société la consomme en grande quantité. C'est ce qui explique le développement, au rythme de 10 à 15% l'an, des banques de données: la durée de vie des produits, mais aussi des théories ou des modes, diminue, obligeant à aborder de nouveaux domaines (l'information médicale, par exemple, se périme tous les cinq ans).
L’époque où un chercheur passait des journées à faire une recherche rétrospective dans une bibliothèque devrait être terminée. Retrouver des documents sur vingt ans est maintenant relativement rapide grâce aux BDD.

Historique des banques de données

Les banques de données sont nées, dans les années 60, aux Etats- Unis, de la conjonction des progrès de l'informatique et de la volonté du gouvernement américain d'améliorer l'efficacité de la recherche dans les domaines proches de la défense (énergie nucléaire, espace). De nombreuses initiatives publiques ont facilité l'émergence de plu- sieurs sociétés privées, qui ont développé une activité de centre serveur. Ces serveurs, qui existent toujours, ont été accessibles dès le début des années 70 par les réseaux internationaux de télécommunications. C'est ainsi que, dans le monde entier, les chercheurs -qui parlent presque tous anglais -ont commencé à utiliser les banques de données américaines.
En Europe, des programmes ont été successivement développés, depuis 1975, par la Commission des communautés européennes (aujourd'hui Impact II pour la période 1991-1995), pour stimuler l'offre et sensibiliser les utilisateurs potentiels. Comme dans les autres pays développés, le gouvernement français a aidé le secteur des banques de données. Dès 1973 et jusqu'à aujourd'hui, différents organismes ont financièrement soutenu tous les maillons de la chaîne en aidant à la création de banques de données, à l'écriture de logiciels d'interrogation, au lancement de serveurs et d'un réseau d'intermédiaires publics.

Le secteur dans lequel la France est clairement leader est le vidéotex, avec 90 % des terminaux vidéotex de la Communauté européenne, soit 6 millions de Minitel (en 1991,75 millions de connexions/mois). Le nombre d'heures de connexion sur le réseau Télétel français at- teint plus de 9 millions par mois, contre 2 millions en Allemagne, qui arrive en deuxième position. Ce succès est dû à la politique adoptée par l'opérateur public France Télécom, qui a imaginé le remplace- ment de l'annuaire téléphonique papier par un annuaire électronique et a fourni le terminal vidéotex (le Minitel) gratuitement. L’adoption du «système kiosque» a donné une impulsion certaine à ce marché.

 

Quelques chiffres
(Source: The Gale Directory of Databases, édition 1993)
- 5 183 banques de données existantes (en 1972, 30 banques), dont 300 en médecine et sciences ;
- 2 204 producteurs de données (30 en 1972) ;
- 800 serveurs ;
- d'autre part, 3500 titres de CD-ROM existent à l'heure actuelle.

 

Définitions

ASCII
American Standard Code for Information Interchange ; norme de codage utilisée dans le monde entier pour les caractères échangés entre ordinateurs. Les banques de données dites ASCII sont les plus anciennes et sont toujours très utilisées par les professionnels de l'information.

Audiotex
Technologie qui permet de proposer des services de télématique vocale interactive ou d'informations téléphonées interrogeables à partir d'un poste téléphonique.

Banque de données
Ensemble de données relatives à un domaine défini des connaissances et organisé pour être offert à la consultation d'utilisateurs.

Kiosque
Système de tarification utilisé, entre autres, pour les services Télétel en France: les utilisateurs paient sur la facture de la ligne téléphonique utilisée l'usage du réseau téléphonique commuté (RTC), celui du réseau spécialisé Transpac et le prix du service consulté. Une partie de cette somme est reversée au fournisseur de service, qui se rémunère de cette façon.

Minitel
Terminal d'interrogation avec modem intégré, distribué par France Télécom, utilisant les normes graphiques du vidéotex et, pour les Minitel bi-standard, également la norme ASCII.

Modem
Abréviation de «modulateur-démodulateur». Sert à convertir les signaux contenant l'information à chaque extrémité d'une ligne de transmission de données. Peut être interne ou externe.

Producteur
Organisme public, professionnel ou privé qui sélectionne l'information, la traite et la fournit sur un support magnétique (l'INIST-CNRS pour la banque de données PASCAL, par exemple).

Recherche en ligne
Interrogation d'une banque de données en temps réel à l'aide d'un micro-0rdinateur, d'un modem et de la ligne téléphonique.

Serveur
Organisme possédant les moyens informatiques nécessaires au chargement des banques de données fournies par les producteurs (Questel est le plus important serveur pour la France).

Télématique
Ensemble de services d'origine informatique pouvant être fournis à travers un réseau de télécommunications (exemple du Minitel en France).

Videotex
Procédé de télécommunication permettant de présenter des messages alphanumériques ou graphiques sur un écran de visualisation. Le procédé utilise le réseau téléphonique et permet le dialogue entre utilisateurs et la consultation de banques de données. Le terminal utilisé peut être un ordinateur équipé d'un modem et d'un logiciel spécifique ou un Minitel.

La production d'une banque de données

L'auteur

Un certain nombre d'articles, d'ouvrages, sont publiés chaque année. Leurs auteurs sont amenés à les écrire dans le cadre de travaux de recherche ou d'enseignement.

Le producteur

Une BDD est construite à partir de documents originaux tels que livres, articles de revues, thèses, documents photographiques. C'est le rôle du producteur de la BDD (l'INIST-CNRS pour PASCAL, la National Library of Medicine pour Medline) de récolter ces informations originales, de les trier, de les traiter en les indexant avec des équipes de documentalistes et d'experts (des médecins pour la médecine, des juristes pour le droit, etc...). Le producteur crée également la liste des mots clés (thesaurus MeSH -Medical Subject Headings - pour Medline ; PASCAL) correspondant à un document, qui servira à l'utilisateur pour sélectionner ce qu'il désire. Les fichiers ainsi créés (document, résumé, index) constituent la banque de données. Actuellement, les producteurs sont aussi bien des entreprises, des organismes publics, des sociétés savantes, des associations professionnelles que des spécialistes.

Le serveur

Les données récoltées (notices signalétiques normalisées avec ou sans résumé qui serviront à informer l'utilisateur sur le contenu du document) sont enregistrées sur une bande magnétique et envoyées au serveur (Questel en France, Dialog aux Etats-Unis, 1er serveur mondial avec 450 BDD...), qui se charge de les stocker sur un ordinateur central. Le serveur est relié, par l'intermédiaire d'un réseau (en général une combinaison de réseau téléphonique et de réseau télématique), à un terminal (micro-ordinateur ou Minitel). Ce terminal permet à l'utilisateur (utilisateur final ou intermédiaire) d'interroger la banque de données et de trouver les informations dont il a besoin. On peut donc trouver, sur un même serveur, quantité de productions d'informations de sources différentes: Questel propose, en effet, l'accès à 70 BDD. qui ne sont pas toutes médicales. On peut citer également l'Agence spatiale européenne avec son centre serveur ESA/IRS (70 BDD) ; l'Européenne de données (40 BDD) ; le SUNIST (12 BDD).

Le vendeur

Les données accessibles constituent ainsi un fichier informatisé dont la présentation est normalisée. Les supports, pour diffuser les BDD, sont désormais multiples: en ligne, télématique, sur CD-ROM, sur disquette. Il ne faut pas confondre le producteur avec le vendeur d’information, même si, parfois, les deux rôles peuvent se confondre, Il existe parfois des intermédiaires, dont la fonction est d'effectuer une sélection sur certaines parties de la base de données.

Les intermédiaires

Les intermédiaires de l'information (brokers en anglais) jouent le rôle de détaillants de l'information. Ce sont des organismes publics ou privés qui interrogent les banques de données pour le compte de l'utilisateur.
C'est le cas des bibliothèques et centres de documentation, par exemple.

Le formateur

Il est nécessaire de former J'utilisateur aux techniques d'interrogation, que celui-ci soit un(e) infirmier(e), un médecin ou un(e) documentaliste.
Le documentaliste a également un rôle important de formateur à jouer dans son propre service, et ce à plusieurs niveaux: il lui faudra se former lui-même, former ses collaborateurs et, enfin, former ses utilisateurs.
Ce rôle de formateur est essentiel, car la profession de documentaliste est basée sur la transmission de l'information.
L’information médicale automatisée (IMA) à l'INSERM ou les unités régionales de formation et de promotion pour l'information scientifique et technique (URFIST) forment aux nouveaux modes d'accès à l'information (BDD, CD-ROM).

Typologie des banques de données

On distingue trois grandes familles de banques de données, qui se différencient par leur mode de diffusion, les possibilités de recherche offertes et les clientèles visées :
La première famille est celle des banques de données classiques, à la norme ASCII. Leur utilisation est réservée aux professionnels de l'information, qui doivent connaître les langages d'interrogation spécifiques à chaque serveur, avec lesquels il faut préalablement signer un contrat. Elles proposent des volumes d'information qui peuvent se compter en millions de documents et permettent des recherches très sophistiquées sur des questions complexes.
La deuxième famille de banques de données est constituée par les CD-ROM (disques compacts), qui offrent parfois des images et des sons en complément du texte. Apparus au milieu des années 80, ils peuvent stocker des volumes importants d’information (mais moins qu'une banque de données classique sur un grand serveur) et permettent des recherches rapides et sophistiquées, avec ou sans langage d'interrogation. En 1992, on estimait à 600000 le nombre de lecteurs de CD-ROM en Europe (50000 en France).
La troisième famille est celle des banques de données vidéotex -banques de données Télétel en France -conçues pour l'utilisateur final, qui doit pouvoir les interroger sans apprentissage préalable; on en compte environ 300 sur le réseau T&eac
te;létel. Elles proposent des informations professionnelles accessibles à partir d'un Minitel et, pour la grande majorité, sans abonnement. C’est ce qu.on appelle aussi la «télématique », contraction des mots télécommunication et informatique, terme proposé par Simon Nora et Alain Minc en 1978 dans leur Rapport sur l’informatisation de la société.

Des types différents d'information

Ces trois familles de banques de données peuvent proposer différents types d'information. Des références bibliographiques (articles de périodiques, ouvrages, thèses, comptes rendus de congrès, documents audio-visuels ou iconographiques), souvent avec résumé et mots clés: ce sont des BDD bibliographiques, telles Medline ou Pascal; l'intégralité d'articles de quotidiens, de lettres ou de revues spécialisées, ainsi que d'études de marché sous forme d’image complète du document: ce sont des BDD textuelles et des BDD en texte intégral (full-text) ; des chiffres (séries statistiques [économie, météorologie...], propriétés des matériaux, etc.) : ce sont des BDD factuelles ou numériques (la BIAM, Banque d'informations automatisées sur les médicaments; ECOSANTE, en économie de la santé, mise au point par le CREDES) ; des informations dont la mise en forme est liée à leur nature même: structures chimiques, brevets, marques, opportunités d'affaires... Elles fournissent des données validées et analysées.
Une autre famille, plus récente et de nature légèrement différente, est celle des services d'information vocale ou services audiotex, qui sont accessibles à partir d'un simple téléphone et pour lesquels le dialogue se fait à partir des touches du téléphone.
Enfin, l'hypertexte permet de lier des données brutes, le texte correspondant et la bibliographie.

Interroger une banque de données

La rapidité

La connexion à une banque de données est quasi instantanée quels que soient son éloignement, l'heure et le lieu où l'on se trouve. Elle peut fournir une information directement utilisable (texte intégral d’un article, adresse d'une entreprise...) ou, dans le cas d'une référence, la possibilité d'obtenir en quelques jours, voire en une heure par fax, la copie des articles. D'autre part, la mise à jour des banques de données se fait de plus en plus rapidement, jusqu'à plusieurs fois par jour (pour la BDD de l'agence France-presse, par exemple), et certaines publications sont même disponibles «en ligne» avant d'être imprimées (cela est surtout vrai dans le domaine de la médecine: l'exemple le plus frappant étant le Online Clinical Trials qui n'existe pas sur support papier, mais est uniquement consul table à partir d'un ordinateur.

L'étendue du champ de recherche

L’ensemble des banques de données donne accès à plusieurs centaines de millions de documents dans tous les domaines de la connaissance, ce qui est sans commune mesure avec les ressources d’un centre de documentation traditionnel. De plus, fournies sous forme informatique, elles peuvent être intégrées à une base de données interne grâce au télédéchargement.

L'interactivité

Compte tenu du très faible temps de réponse, il est fréquent que les résultats obtenus fassent évoluer la question, dont la nouvelle formulation apportera de nouvelles réponses, et ainsi de suite. Cela surtout pour les données factuelles et les statistiques.

La complexité

Dans une recherche manuelle, on peut prendre en compte deux critères de recherche, trois au maximum, alors que, dans une recherche effectuée par les banques de données, le nombre de critères peut dépasser la dizaine et plus.

 

Pour en savoir plus sur les banques de données


- Répertoire des banques de données professionnelles, Paris, ADBS-ANRT, 1993.
- Annuaire du CD-ROM, Paris, A Jour, 1992.
- Directory of Gale Databases, Gale Research, 1993.
- Répertoire d s banques de données biomédicales, Paris, FLA, 1991-1992.
Information en ligne :
- CUADRA (serveur QUESTEL).
- Database of databases (serveur DIALOG).
- 36 17 INFOBDD : répertoire de 2000 BDD professionnelles.

 

Adresses des centres serveurs français


- QUESTEL Le Capitole, 55, avenue des Champs-Pierreux -92029 NanterreCedex, Tél. : (1) 46145555
- CEDOCAR Centre de documentation des armées, 26, bd Victor -00460 Paris Armées, Tél. : (1) 45524577
- SUNSIT, 950, rue de St-Priest -BP 7229- 34184 Montpellier Cedex 4, Tél. :67141414
-TELECONSULTE LAMY (droit), 187/189, quai de Valmy -75490 Paris Cedex 10, Tél. (1) 4472 1222
-L’EUROPENNE DE DONNEES / GROUPE OR, 164 ter, rue d’Aguesseau 92100 Boulogne-Billancourt -Tél. : (1) 46052929

cop. JP Accart, 2007

 

{

Abonnement

Recevez chaque mois par mail l’Edito et les mises à jour du site. Entrez votre adresse e-mail:

Nom:
Courriel: