Les Techniques documentaires
(1994) - Les banques de données: historique et production
Le Micro-Bulletin du CNRS, 1994, n° 56, pp. 104-111.
En complément de l'état de l'offre en matière de banques de données biomédicales (publié dans le précédent Micro Bulletin), Jean-Philippe Accart nous offre ici des explications plus méthodologiques qui devraient vous aider dans l'utilisation des banques de données que vous êtes (ou serez) amenés à consulter dans votre démarche de recherche d'information.
C'est cette même démarche de recherche d'information que vous effectuez en utilisant un logiciel de gestion bibliographique tel que Bibliodoc, dont nous reparlons dans ce numéro. Ce qui nous intéresse aujourd'hui, c'est l'évolution de ce logiciel et les améliorations qui y ont été apportées depuis la version précédente. Il nous a donc paru plus intéressant de laisser parler un utilisateur de cette nouvelle version après rappel des .fonctionnalités principales exposées par Bernard Lassalle dans le n° 47 de la revue, que nous republions ici en partie.
Un centre de documentation, une bibliothèque, aussi fournis soient-ils en documents papier et audiovisuels, ne peuvent tout posséder. L’important pour ces structures est également d'offrir à ses usagers le plus d'accès possibles à l'information. Il existe, depuis les années 70, de gigantesques réservoirs d'informations: les banques de données. Par rapport à la recherche traditionnelle d'information, la recherche informatisée donne la possibilité de repérer très rapidement l'information ou des références de documents, parfois même le texte intégral de l'information recherchée. Il est devenu très important pour les chercheurs de connaître ces sources de données potentielles, de savoir comment y accéder et d'avoir les moyens de les interroger.
Généralités sur les banques de données
L’information peut être considérée comme une nouvelle matière première, et notre société la consomme en grande quantité. C'est ce qui explique le développement, au rythme de 10 à 15% l'an, des banques de données: la durée de vie des produits, mais aussi des théories ou des modes, diminue, obligeant à aborder de nouveaux domaines (l'information médicale, par exemple, se périme tous les cinq ans).
L’époque où un chercheur passait des journées à faire une recherche rétrospective dans une bibliothèque devrait être terminée. Retrouver des documents sur vingt ans est maintenant relativement rapide grâce aux BDD.
Historique des banques de données
Les banques de données sont nées, dans les années 60, aux Etats- Unis, de la conjonction des progrès de l'informatique et de la volonté du gouvernement américain d'améliorer l'efficacité de la recherche dans les domaines proches de la défense (énergie nucléaire, espace). De nombreuses initiatives publiques ont facilité l'émergence de plu- sieurs sociétés privées, qui ont développé une activité de centre serveur. Ces serveurs, qui existent toujours, ont été accessibles dès le début des années 70 par les réseaux internationaux de télécommunications. C'est ainsi que, dans le monde entier, les chercheurs -qui parlent presque tous anglais -ont commencé à utiliser les banques de données américaines.
En Europe, des programmes ont été successivement développés, depuis 1975, par la Commission des communautés européennes (aujourd'hui Impact II pour la période 1991-1995), pour stimuler l'offre et sensibiliser les utilisateurs potentiels. Comme dans les autres pays développés, le gouvernement français a aidé le secteur des banques de données. Dès 1973 et jusqu'à aujourd'hui, différents organismes ont financièrement soutenu tous les maillons de la chaîne en aidant à la création de banques de données, à l'écriture de logiciels d'interrogation, au lancement de serveurs et d'un réseau d'intermédiaires publics.
Le secteur dans lequel la France est clairement leader est le vidéotex, avec 90 % des terminaux vidéotex de la Communauté européenne, soit 6 millions de Minitel (en 1991,75 millions de connexions/mois). Le nombre d'heures de connexion sur le réseau Télétel français at- teint plus de 9 millions par mois, contre 2 millions en Allemagne, qui arrive en deuxième position. Ce succès est dû à la politique adoptée par l'opérateur public France Télécom, qui a imaginé le remplace- ment de l'annuaire téléphonique papier par un annuaire électronique et a fourni le terminal vidéotex (le Minitel) gratuitement. L’adoption du «système kiosque» a donné une impulsion certaine à ce marché.
Quelques chiffres |
Définitions ASCII Audiotex Banque de données Kiosque Minitel Modem Producteur Recherche en ligne Serveur Télématique Videotex |
La production d'une banque de données
L'auteur
Un certain nombre d'articles, d'ouvrages, sont publiés chaque année. Leurs auteurs sont amenés à les écrire dans le cadre de travaux de recherche ou d'enseignement.Le producteur
Une BDD est construite à partir de documents originaux tels que livres, articles de revues, thèses, documents photographiques. C'est le rôle du producteur de la BDD (l'INIST-CNRS pour PASCAL, la National Library of Medicine pour Medline) de récolter ces informations originales, de les trier, de les traiter en les indexant avec des équipes de documentalistes et d'experts (des médecins pour la médecine, des juristes pour le droit, etc...). Le producteur crée également la liste des mots clés (thesaurus MeSH -Medical Subject Headings - pour Medline ; PASCAL) correspondant à un document, qui servira à l'utilisateur pour sélectionner ce qu'il désire. Les fichiers ainsi créés (document, résumé, index) constituent la banque de données. Actuellement, les producteurs sont aussi bien des entreprises, des organismes publics, des sociétés savantes, des associations professionnelles que des spécialistes.Le serveur
Les données récoltées (notices signalétiques normalisées avec ou sans résumé qui serviront à informer l'utilisateur sur le contenu du document) sont enregistrées sur une bande magnétique et envoyées au serveur (Questel en France, Dialog aux Etats-Unis, 1er serveur mondial avec 450 BDD...), qui se charge de les stocker sur un ordinateur central. Le serveur est relié, par l'intermédiaire d'un réseau (en général une combinaison de réseau téléphonique et de réseau télématique), à un terminal (micro-ordinateur ou Minitel). Ce terminal permet à l'utilisateur (utilisateur final ou intermédiaire) d'interroger la banque de données et de trouver les informations dont il a besoin. On peut donc trouver, sur un même serveur, quantité de productions d'informations de sources différentes: Questel propose, en effet, l'accès à 70 BDD. qui ne sont pas toutes médicales. On peut citer également l'Agence spatiale européenne avec son centre serveur ESA/IRS (70 BDD) ; l'Européenne de données (40 BDD) ; le SUNIST (12 BDD).Le vendeur
Les données accessibles constituent ainsi un fichier informatisé dont la présentation est normalisée. Les supports, pour diffuser les BDD, sont désormais multiples: en ligne, télématique, sur CD-ROM, sur disquette. Il ne faut pas confondre le producteur avec le vendeur d’information, même si, parfois, les deux rôles peuvent se confondre, Il existe parfois des intermédiaires, dont la fonction est d'effectuer une sélection sur certaines parties de la base de données.Les intermédiaires
Les intermédiaires de l'information (brokers en anglais) jouent le rôle de détaillants de l'information. Ce sont des organismes publics ou privés qui interrogent les banques de données pour le compte de l'utilisateur.C'est le cas des bibliothèques et centres de documentation, par exemple.
Le formateur
Il est nécessaire de former J'utilisateur aux techniques d'interrogation, que celui-ci soit un(e) infirmier(e), un médecin ou un(e) documentaliste.Le documentaliste a également un rôle important de formateur à jouer dans son propre service, et ce à plusieurs niveaux: il lui faudra se former lui-même, former ses collaborateurs et, enfin, former ses utilisateurs.
Ce rôle de formateur est essentiel, car la profession de documentaliste est basée sur la transmission de l'information.
L’information médicale automatisée (IMA) à l'INSERM ou les unités régionales de formation et de promotion pour l'information scientifique et technique (URFIST) forment aux nouveaux modes d'accès à l'information (BDD, CD-ROM).
Typologie des banques de données
On distingue trois grandes familles de banques de données, qui se différencient par leur mode de diffusion, les possibilités de recherche offertes et les clientèles visées :La première famille est celle des banques de données classiques, à la norme ASCII. Leur utilisation est réservée aux professionnels de l'information, qui doivent connaître les langages d'interrogation spécifiques à chaque serveur, avec lesquels il faut préalablement signer un contrat. Elles proposent des volumes d'information qui peuvent se compter en millions de documents et permettent des recherches très sophistiquées sur des questions complexes.
La deuxième famille de banques de données est constituée par les CD-ROM (disques compacts), qui offrent parfois des images et des sons en complément du texte. Apparus au milieu des années 80, ils peuvent stocker des volumes importants d’information (mais moins qu'une banque de données classique sur un grand serveur) et permettent des recherches rapides et sophistiquées, avec ou sans langage d'interrogation. En 1992, on estimait à 600000 le nombre de lecteurs de CD-ROM en Europe (50000 en France).
La troisième famille est celle des banques de données vidéotex -banques de données Télétel en France -conçues pour l'utilisateur final, qui doit pouvoir les interroger sans apprentissage préalable; on en compte environ 300 sur le réseau T&eac
te;létel. Elles proposent des informations professionnelles accessibles à partir d'un Minitel et, pour la grande majorité, sans abonnement. C’est ce qu.on appelle aussi la «télématique », contraction des mots télécommunication et informatique, terme proposé par Simon Nora et Alain Minc en 1978 dans leur Rapport sur l’informatisation de la société.
Des types différents d'information
Ces trois familles de banques de données peuvent proposer différents types d'information. Des références bibliographiques (articles de périodiques, ouvrages, thèses, comptes rendus de congrès, documents audio-visuels ou iconographiques), souvent avec résumé et mots clés: ce sont des BDD bibliographiques, telles Medline ou Pascal; l'intégralité d'articles de quotidiens, de lettres ou de revues spécialisées, ainsi que d'études de marché sous forme d’image complète du document: ce sont des BDD textuelles et des BDD en texte intégral (full-text) ; des chiffres (séries statistiques [économie, météorologie...], propriétés des matériaux, etc.) : ce sont des BDD factuelles ou numériques (la BIAM, Banque d'informations automatisées sur les médicaments; ECOSANTE, en économie de la santé, mise au point par le CREDES) ; des informations dont la mise en forme est liée à leur nature même: structures chimiques, brevets, marques, opportunités d'affaires... Elles fournissent des données validées et analysées.
Une autre famille, plus récente et de nature légèrement différente, est celle des services d'information vocale ou services audiotex, qui sont accessibles à partir d'un simple téléphone et pour lesquels le dialogue se fait à partir des touches du téléphone.
Enfin, l'hypertexte permet de lier des données brutes, le texte correspondant et la bibliographie.
Interroger une banque de données
La rapidité
La connexion à une banque de données est quasi instantanée quels que soient son éloignement, l'heure et le lieu où l'on se trouve. Elle peut fournir une information directement utilisable (texte intégral d’un article, adresse d'une entreprise...) ou, dans le cas d'une référence, la possibilité d'obtenir en quelques jours, voire en une heure par fax, la copie des articles. D'autre part, la mise à jour des banques de données se fait de plus en plus rapidement, jusqu'à plusieurs fois par jour (pour la BDD de l'agence France-presse, par exemple), et certaines publications sont même disponibles «en ligne» avant d'être imprimées (cela est surtout vrai dans le domaine de la médecine: l'exemple le plus frappant étant le Online Clinical Trials qui n'existe pas sur support papier, mais est uniquement consul table à partir d'un ordinateur.L'étendue du champ de recherche
L’ensemble des banques de données donne accès à plusieurs centaines de millions de documents dans tous les domaines de la connaissance, ce qui est sans commune mesure avec les ressources d’un centre de documentation traditionnel. De plus, fournies sous forme informatique, elles peuvent être intégrées à une base de données interne grâce au télédéchargement.L'interactivité
Compte tenu du très faible temps de réponse, il est fréquent que les résultats obtenus fassent évoluer la question, dont la nouvelle formulation apportera de nouvelles réponses, et ainsi de suite. Cela surtout pour les données factuelles et les statistiques.La complexité
Dans une recherche manuelle, on peut prendre en compte deux critères de recherche, trois au maximum, alors que, dans une recherche effectuée par les banques de données, le nombre de critères peut dépasser la dizaine et plus.
Pour en savoir plus sur les banques de données- Répertoire des banques de données professionnelles, Paris, ADBS-ANRT, 1993. - Annuaire du CD-ROM, Paris, A Jour, 1992. - Directory of Gale Databases, Gale Research, 1993. - Répertoire d s banques de données biomédicales, Paris, FLA, 1991-1992. Information en ligne : - CUADRA (serveur QUESTEL). - Database of databases (serveur DIALOG). - 36 17 INFOBDD : répertoire de 2000 BDD professionnelles. |
Adresses des centres serveurs français cop. JP Accart, 2007 |
Twitter
LinkedIn