au menu au contenu

(1993) - L'information biomédicale au futur

Le Micro-Bulletin du CNRS, 1993, n° 52, pp. 145-149.

Introduction : l'information en chiffres et les nouvelles technologies

Pour citer quelques chiffres probants en termes d'édition papier, prenons différentes sources : l'Ulrich's Periodicals Directory, dans sa 31ème édition (1992/93), dénombre 126 000 titres de périodiques existants. The Serials Directory (EBSCO) cite 20 millions d'articles publiés annuellement, soit 80 000 par jour ! . D'autre part, The Gale Directory of Databases, dans son édition de 1993, donne les chiffres suivants :

  • 5183 banques de données existantes (en 1972, 30 banques)
  • et 2204 producteurs de données (30 en 1972)
  • d'autre part, 1200 titres de CDROM existent à l'heure actuelle.

En pourcentage, cela donne :

  • en 1972, 83 % de BDD scientifiques et techniques et 15 % juridiques et économiques
  • en 1990, 35 % BDD sc et techn., 45 % BDD jur. et éco., 15 sociales et actualités

Le marché européen est largement dominé par les services américains (à la fois, en chiffres d'affaires et en produits proposés) :

  • USA : 58 % des BDD existantes
  • Europe, 34, 6 %
  • France : 12 % de la production européenne

Il apparait donc clairement que l'on assiste à une explosion de l'information, que ce soit sous la forme de documents primaires ou que ceux-ci soient traités et indexés, d'où la multiplication des banques de données. Comment accéder à cette information ? : réseaux de télécommunication, satellites, nouvelles technologies type CDROM ou disque optique numérique (DON), disque inscriptible (WORM), digitalisation, numérisation, forme électronique, périodique consultable en plein texte, fibres optiques, compression de données, toutes ces nouvelles donnes technologiques bouleversent totalement l'accès et la fourniture de l'information, et plus particulièrement l'information biomédicale.

D'autres parallèles sont à prendre en considération :

  • la montée en puissance des ordinateurs personnels dont les prix baissent et la capacité en mémoire augmente.
  • de plus, les compagnies traditionnelles de téléphone travaillent de plus en plus ensemble en vue de créer des réseaux internationaux : rapprochement récents de ATT et Macaw Cellular aux Etats-Unis, British Telecom et MCI en Grande-Bretagne.
  • les logiciels permettant d'avoir un standard international pour les publications se développent . Un des plus récents est ADOBE ACROBAT.

I) Les grands centres de fourniture de documents

Pour l'utilisateur final, en l'occurrence en ce qui concerne l'information biomédicale et/ou scientifique, le médecin, le chercheur ou l'étudiant, l'accès à cette information est primordiale ; il lui faut trouver des réponses précises et immédiates sur des points précis tels que :

  • répondre à un problème posé par un malade
  • soigner une pathologie particulière
  • connaitre les interactions médicamenteuses
  • être au courant de la littérature existant sur un sujet particulier
  • rédiger une thèse, un mémoire, un article...

De plus en plus, le bibliothécaire-documentaliste est sollicité en vue de fournir une information valable et vérifiable, ainsi qu'une délivrance rapide de l'article demandé. La proportion du budget dévolu aux périodiques dans une bibliothèque universitaire est d'environ 70 %, mais avec la montée croissante du prix des abonnements, ce budget décroit de 3 et 4 % par an. Le recours aux grands centres de fournitures de documents est de plus en plus fréquents.

De grands centres de fourniture de documents ont été créés. En Europe :

  • l'INIST-CNRS (Nancy)
  • The British Library Document Supply Centre (BLDSC) soit 3, 4 millions d'articles fournis en 1991. Ce centre existe depuis une trentaine d'années.
  • l' OCLC aux Etats-Unis
  • et TIBDOC (Hanovre) parmi les principaux.

Des institutions, telles l'INIST à Nancy ou la Finnish Medical Association ont déjà misé sur le futur. D'autres projets, plus globaux, (le projet EDIL de la Communauté Economique Européenne) visent à ce que les grands centres de fourniture de documents collaborent.

A)L'exemple de l'INIST à Nancy

Les collections de l'INIST couvrent la littérature scientifique et technique, les rapports, les actes de congrès, soit un répertoire de 27000 titres de périodiques. Parmi ces titres, 2000 ont été choisis afin de mettre sur pied le projet de fourniture électronique de documents. Les documents sélectionnés sont systématiquement scannés en mode digital. Cette digitalisation, commencée en 1990, représente un volume de 2 millions de pages par an : les images sont stockées sur un disque WORM (6, 4 gigabyte), dont la capacité d'une face est de 70 000 pages. Un chargeur contenant 131 disques est relié à trois micro-ordinateurs : ceux-ci sont équipés de tableaux de télécommunication ; la transmission sur les réseaux de télécommunication est ainsi possible pour la délivrance des documents (pour la France, via NUMERIS).
L'INIST reçoit des demandes de documents par l'intermédiaire des grands serveurs (Questel, Dialog, Esa, ...) ou par le prêt interbibliothèque électronique (PEB ou OCLC) ou le Minitel. Les autres formes classiques de demandes de documents (fax, téléphone, formes papiers) sont également possibles. Si le document demandé est disponible sous format digital, il sera fourni par fax (Groupe III ou IV). Ce système n'entraine pratiquement pas d'intervention humaine. A l'heure actuelle, 45 % des documents fournis par l'INIST sont stockés sous forme électronique.

B)L'exemple finlandais : FINMET, réseau médical finnois

L'Association Médicale Finnoise (FMA) a créé depuis le milieu des années 1980 un réseau d'information appelé FINMET (sur le modèle américain AMANET) afin de répondre aux besoins de quelques 600 médecins. Ce réseau utilise la messagerie électronique, ce qui permet rapidité et confidentialité, et donne la possibilité de communiquer individuellement ou avec un groupe de personnes, ainsi que des accès télématiques à différents services (bancaires, transports, d'actualité): ceci afin de faciliter les contacts entre physiciens. FINMET met ainsi à la portée de tout physicien et des bibliothèques universitaires hospitalières, les services de la FMA et des grandes banques de données biomédicales telle Medline.

C)Le projet EDIL de la Communauté Européenne

Le projet EDIL (Electronic Document Interchange between Libraries) a débuté en janvier 1993. Il doit rendre effectif l'échange de documents électroniques entre 4 réseaux européens de bibliothèques :

  • le système PICA aux Pays-Bas
  • le British Library Document Supply Center en Grande-Bretagne
  • le Ministère de l'Enseignement Supérieur et de la Recherche en France
  • l'UniversitätsBibliothek et le Technische InformationsBibliothek de Hanovre

Ce projet assurera à l'Europe un rôle majeur dans le développement du marché mondial de la fourniture de documents, marché qui doit considérablement s'amplifier dans les 20 années à venir.
Avec la crise économique, les bibliothèques cherchent des solutions et des alternatives à la fourniture de documents. Les moyens actuels de télécommunications et la technologie informatique permettent de transmettre l'information rapidement et à un coût raisonnable. Le prêt interbibliothèque s'est ainsi accru ces dernières années de façon irrépressible. On estime à 20 millions les documents fournis par le prêt interbibliothèque dans le monde.

Cependant, les éditeurs scientifiques réagissent et utilisent eux aussi les nouvelles technologies.

II) Les éditeurs scientifiques et les publications électroniques

A) Les publications électroniques

Actuellement, on va vers une relation de plus en plus directe entre le lecteur et la littérature, et cela veut dire que le rôle des intermédiaires, bibliothécaires, documentalistes, doit être repensé. D'autre part, et cela est lié, les bibliothèques deviennent immatérielles. Le support se transforme, et d'un support écrit devient support électronique, qui a dépassé le stade des balbutiements.

La publication électronique offre beaucoup d'avantages : rapidité de mise à jour, interactions entre l'auteur, l'éditeur et le lecteur, résolution des problèmes d'illustration. La parution des tables de sommaires, des contents, est encore plus rapide : ainsi SPRINGER VERLAG a-t-il mis en ligne les sommaires de près de 40 titres scientifiques et médicaux.

D'autres périodiques ont mis leur full text sur INTERNET, accessible donc à des prix réduits. Cela nous conduit au point suivant qui concerne la fourniture de documents par voie électronique, notamment le Online Journal of Clinical Trials (Elzevier).
Les bases plein-texte médicales sont parmi les premières à être apparues. Elles couvrent plusieurs types de documents puisque cela va d'un périodique uniquement , le New England Journal of Medicine ou le Morbidity and Mortality Weekly Report à une collection de plusieurs titres comme l'ensemble des revues de l'American Medical Association. MEDTEXT (sur Dialog), donne le texte intégral d'un certain nombre de périodiques médicaux depuis 1982 avec mises à jour mensuelles, soit 55 000 références.

D'autres périodiques sont également concernés, en particulier ceux du domaine de la recherche, tout simplement parce que la publication électronique réduit les délais d'impressions toujours longs sous forme papier. Dans le créneau des journaux de recherche, on peut citer On Line Journal of Clinical Trials lancé début 1992 qui ne sera disponible que sous forme électronique. Ce titre a été choisi pour que les malades puissent bénéficier plus tôt des recherches et des découvertes.

On trouve également Drug Information Full Text, l'une des bases de données de pharmacie les plus importantes dans le monde. Elle fournit une information complète sur 50000 produits commercialisés.

Et là aussi, les choses partent dans tous les sens. Les expériences de transmission par satellite, malgré la lourdeur des structures exigées se développent plus qu'on ne le croirait. Se profile également à l'horizon une nouvelle génération de fax qui peut expédier directement un document, sans photocopie préalable, et le mettre sur INTERNET.

Bien plus le processus de scanérisation des textes s'amplifie. Sans parler de FOUDRE, sans parler du projet européen qui devrait l'amplifier, sans parler de ce que fait l'INIST, disons si vous le voulez bien quelques mots sur CARL qui, des Etats-Unis commence à traverser l'Atlantique. Il s'agissait au départ d'un réseau de coopération de bibliothèques dans l'état du Colorado et CARL signifie COLORADO ALLIANCE RESEARCH LIBRARIES. Mais très vite le réseau s'est étendu et actuellement CARL propose plus de DEUX millions de documents uniquement sous forme scanérisée, disponibles en 24 heures ou au pire en 48 heures, le demandeur devant payer par carte de crédit. Là aussi c'est une offensive directe vers le lecteur, l'usager lui-même. Le danger est si grand que même la BRITISH LIBRARY, qui est pourtant un des pôles majeurs dans ce domaine, s'est associée entre autres avec CARL.

B) Les éditeurs scientifiques

Les grands éditeurs scientifiques mondiaux ont cherché une réponse au problème de l'accès à l'information. La forme électronique du périodique scientifique (c'est-à-dire en plein texte, consultable en ligne ou sur CDROM) semble être la réponse la plus appopriée. Parmi les principaux éditeurs scientifiques mondiaux, on peut citer :

  • Blackwell en Grande-Bretagne
  • Cambridge Scientific Abstracts (Bethesda-USA)
  • Elsevier (Amsterdam) qui développe en mode électronique la possibilité de consulter 400 périodiques 2 semaines avant la version imprimée.
  • Springer-Verlag (Allemagne-USA) offre le même service via INTERNET sur 40 périodiques 6 semaines avant publication
  • The Institute for Scientific Information (ISI) à Philadelphie

Les éditeurs scientifiques collaborent de plus en plus. Voici quelques exemples :

1) BRS Information Technologies avec Comprehensive Core Medical Library (CCML) qui propose, en ligne, le texte intégral de 80 périodiques médicaux courants et 16 ouvrages de références, et permet, grâce à la procédure LINK, de passer automatiquement à Medline et Embase, banques de données bibliographiques.

2) Depuis 1992, un nouveau venu américain est apparu en Europe : ce sont les fichiers médicaux de Mead Data qui proposent en ligne des produits très divers :

  • le texte intégral de 14 périodiques depuis 1982
  • le texte intégral de FDC Reports Newsletters : industrie pharmaceutique, équipement et matériel médical, cosmétiques, recherche, médicaments
  • des banques de données telles DRUG INFORMATION FULLTEXT à partir de deux publications de l'American Society of Hospital Pharmacist ; PDQ en cancérologie ; Medline.
  • les bases de données de Micromedex : Micromedex a créé depuis 1974 des BDD qui sont des instruments professionnels, des systèmes d'aide à la décision pour le médecin dans l'exercice de ses fonctions. La rédaction est assurée par plus de 350 experts, avec une équipe rédactionnelle interne et mise à jour tous les trimestres. Cela comprend :
    • POISONDEX : BBD toxicologique
    • EMERGINDEX, écrit par et pour les médecins ayant à pratiquer une médecine d'urgence et à surveiller des affections à risque, pour les aider à faire rapidement un diagnostic exact et procéder à un traitement efficace des patients en phase aigüe. La base est formée de deux fichiers : "Clinical Reviews" et "Clinical Abstracts" et s'interroge grâce à un thesaurus inspiré du Mesh.
    • DRUGDEX donne des informations sur les médicaments, à l'intention des pharmaciens, médecins qui ont à prescrire.

    Ces 3 bases (POISONDEX, EMERGINDEX, DRUGDEX) sont construites sur le même modèle rigoureux, très détaillé. Il est possible d'aller chercher directement à l'intérieur d'un texte sur une affection, un médicament. Des centaines d'hôpitaux américains utilisent ces bases depuis des années.

3) Un dernier exemple est celui de l'éditeur scientifique britannique Blackwell qui a créé depuis 1988 une "joint venture" avec CARL systems Inc afin de développer un produit UNCOVER à un niveau international. Il s'agit de délivrer en ligne le sommaire de 10 000 revues. Ce service est ouvert aux particuliers et aux bibliothèques. Le document choisi parmi ces sommaires peut être commandé en ligne ; il est faxé dans les 24h à un prix de 10 dollars. UNCOVER projette de couvrir 14 000 à 25 000 titres de revues. Cela représentera dans le futur une banque de données exhaustive s'adressant aussi bien à l'utilisateur lambda aux Etats-Unis, qu'en Europe et en Asie.

C) Les périodiques scientifiques sur CDRom

Depuis 1990, on assiste à un incroyable développement de l'édition électronique de périodiques scientifiques, les deux chefs de file en la matière étant la National Library of Medicine aux Etats-Unis et Elsevier le plus grand éditeur mondial de revues scientifiques. Quelques exemples :

  • ADONIS est dirigé par un comité composé de 3 éditeurs : Blackwell, Elsevier, Pergamon et Springer ; 360 périodiques scientifiques en texte intégral sont proposés depuis 1991. Outre l'abonnement proprement dit, des redevances par article imprimé sont versées.
  • The British Medical Journal (NLM-British Medical Association), The Lancet (NLM), The New England Journal of Medicine (NLM), The American Journal of Public Health (NLM), The Annals of Internal Medicine (NLM), The Journal of the American Medical Association (NLM) sont tous consultables sur CDROM sur 5 ans
  • The Pediatric Infectious Diseases Journal est consultable de 1984 à 1990.

D) Les banques de données sur disquettes

Ces BDD sur disquettes regroupent les sommaires des périodiques publiés à travers le monde, sommaires à partir desquels le chercheur retire les informations qui lui semblent les plus pertinentes. Cela lui permet de suivre régulièrement l'actualité scientifique relative à un domaine de recherche.
La banque de données la plus connue et la plus utilisée en France est sans conteste les Current Contents fournie sur abonnement par l'Institute of Scientific Information (ISI) à Philadelphie. Une seconde BDD fonctionne sur le même principe par fourniture hebdomadaire de disquettes : il s'agit de Reference Update diffusée par Research Information System (RIS) . Moins connue, elle peut constituer une alternative aux Current Contents. Toutes les deux fonctionnent de la même manière et dépouillent 1200 périodiques. Les Current sont plus performants du point de vue de l'ergonomie.
Le dictionnaire VIDAL est disponible sur disquette version MAC et Windows (980 F TTC). La mise à jour est permamente.
ECOSANTE du CREDES est un logiciel en économie de la santé qui couvre la période 1950-1992. Il permet d'obtenir tous les chiffres sur la santé en France (mortalité, hospitalisation etc) et d'en faire des graphiques. ECOSANTE existe également pour l'OCDE et par région.
EDISAN, logiciel d'informations et d'enseignement de pathologie tropicale, a été conçu par le Centre de Formation et de Recherches en Médecine et Santé Tropicales de Marseille. Il fournit par pays, toutes les informations concernant la pathologie, l'épidémiologie, la pharmacologie (31 000 F HT. 5000 F/an HT).

III) La communication du futur : les réseaux de télécommunication

A) Les différents types de réseaux existant

Il reste à présenter l'infrastructure des réseaux. Les réseaux transportent l'information qu'on crée (éventuellement), qu'on émet et qu'on reçoit grâce aux moyens de communication. Ce sont des réseaux publics (les lignes de téléphone de FRANCE TELECOM) ou privés (les réseaux des entreprises multinationales), s'appuyant le plus souvent sur des câbles en tant que support physique, mais pouvant faire appel à des liaisons par radio ou par satellite. Ils peuvent utiliser plusieurs techniques d'acheminement : la plus simple est la liaison fixe d'un point à un autre. Ou bien on peut faire appel à une technique de commutation de circuits : pendant un temps donné, un poste est physiquement relié à un autre par l'intermédiaire d'un ou de plusieurs centraux téléphoniques (c'est le principe de la liaison téléphonique actuelle). Enfin les transmissions de données ont mis à l'ordre du jour la technique de commutation de paquets : il s'agit de transférer des données regroupées en une série de paquets, ceux-ci étant acheminés sur des circuits partagés entre les différents utilisateurs.

Les réseaux peuvent se contenter d'assurer le transport et le routage des informations, ou bien proposer des services supplémentaires. Exemple simple : les compléments de services qui sont proposés par FRANCE TELECOM dans le cadre de l'abonnement téléphonique, le transfert d'appel par exemple, sont des services "en plus", de la "valeur ajoutée" à un abonnement par rapport à une simple communication téléphonique.

Les réseaux peuvent également exister à petite échelle, et relier par exemple entre eux les vingt micro-ordinateurs d'une même société. On parle alors de "réseaux locaux".

Un autre type de réseau est le réseau à valeur ajoutée (RVA). Créer un réseau à valeur ajoutée (acronyme RVA) consiste à offrir un ou plusieurs services supplémentaires lors de l'échange d'informations entre deux ou plusieurs parties. L'information échangée (voix, textes, données, images) peut subir un traitement pendant la transmission. L'ajout de valeur provient d'un traitement complémentaire effectué au cours du transport physique sur les lignes de télécommunications, que ce soit au cours d'un échange monodirectionnel comme pour l'envoi d'un message (authentification, remise automatique, éventuelle conversion Télécopie ou Télex, etc.) ou d'un échange bidirectionnel comme c'est la cas pour l'accès aux bases de données.

Avec les progrès de l'informatique et des télécommunications, un grand nombre de prestataires ont pu mettre en place un ou plusieurs serveurs, et faire communiquer entre eux des utilisateurs d'origines diverses. Tout utilisateur qui se connecte à un de ces serveurs peut entrer en relation avec d'autres utilisateurs et accéder à des services.

B) L'exemple américain : la " National Information Infrastructure (NII)".

Tout le monde en parle aujourd'hui, mais qui sait vraiment ce que le terme recouvre ?
Concrètement, la " super-autoroute de l'information " est un grand réseau à travers lequel circulera demain, à très grande vitesse, tout ce que les Etats-Unis comptent d'informations numériques. L'information dont il est question ici n'a évidemment rien à voir avec les " actualités".
Elle désigne l'ensemble des signaux servant à véhiculer images, sons, textes et données. Un information numérique, car aujourd'hui, pour des raisons de facilités de stockage, de traitement et de transmission, tout signal finit tôt ou tard par être converti en séries de " o " et de " 1 ". La super -autoroute de l'information " est donc un tuyau à chiffres, ni plus ni moins.
La " National Information Infrastructure " devait d'abord servir à interconnecter les grands ordinateurs des centres industriels et universitaires, de manière à fédérer la puissance informatique de la recherche américaine et, ainsi, à accroître son efficacité. Il s'agissait aussi, via une politique de " grands travaux " axée sur les télécommunications, de stimuler le secteur des services qui apparaissait- déjà à la fin des années 80- comme d'avantage porteur de croissance et d'emplois que l'industrie manufacturière.
Pour soutenir ce " boom ", voire l'amplifier, l'Amérique doit donc doper ses infrastructures de télécom.
Ces derniers mois, ce programme a pris une nouvelle inflexion sous les coups de boutoir du progès technologique. En particulier, les techniques dites de " compression numérique ", en permettant l'avènement de l'information multimédia ( mêlant texte, image et son ) et de la télévision numérique, ont ouvert au " super-réseau " des perspectives bien plus larges. Englobant cette fois tous les foyers américains. La fibre optique a en effet désormais la capacité de devenir le vecteur unique d'un nombre impressionnant de services : téléphone, téléconférence, télématique, transfert de fichiers informatiques, téléchargement de logiciels de jeux vidéo, mais aussi télévision, télé-achat et autres services multimédias interactifs.
Les techniques sont prêtes, et le support physique du réseau lui-même existe en grande partie: des milliers de kilomètres de fibres optiques relient déjà les grandes villes américaines. Ils ne reste plus qu'à construire les bretelles de l'autoroute, c'est-à-dire à brancher les foyers sur le réseau. Ce travail de ramification sera fort coûteux: on parle d'une facture nationale de plus de 50 milliards de dollars (plus de 280 milliards de francs), à la charge des opérateurs.

En Europe, dans les années 70, ouverture de grands serveurs : ESA-IRS, ECHO, et dans les années 1980, des programmes communs : RACE, COSINE, EARN, GAR (Italie), SWITCH (Suisse). En décembre 1993, la Commission Européenne publiait le Livre Blanc de Jacques Delors qui propose le lancement de grands projets d'infrastructure de réseau d'information en Europe.

C) L'exemple d'un réseau d'entreprise

Digital Equipement Corporation développe depuis plus de dix ans l'un des plus grands réseaux privés du monde, baptisé Easynet, connectant 120 000 utilisateurs répartis dans 65 pays. Chaque poste de travail est reliè au réseau, rendant accessible à chaque salarié toutes les informations utiles. Dans les faits, chacun définit à la carte son propre réseau, car il est impossible de s'intéresser à toutes les applications. On en compte plus de 3 500. Schématiquement, on trouve trois types d'informations : la messagerie électronique, les données de base (livret d'accueil, liste de prix, organigrammes ...) et des "forums" où les salariés du monde entier conversent sur les nouveaux produits ou autour de centres d'intérêts plus personnelles (comme le chocolat! ).
A l'usage, les avantges du réseau se sont révèlés nombreux. Reliant tous les niveaux hiérarchiques de l'entreprise et tous les services, le réseau est un véritable outil de démocratisation de l'information qui a bouleversé le management. Certains accès restent toutefois strictement privés pour des questions de confidentialité. En outre, le partage en temps réel des informations permet de gagner du temps et facilite la coordination internationale des efforts. En cas de problème, l'entreprise mobilise aussi l'ensemble de ses compétences internationales quasiment instantanément. Ainsi, les experts de chaque discipline travaillent sur le réseau, favorisant les synergies et évitant les déplacements longs et fatigants.
Enfin, en se branchant sur une simple prise, le cadre nomade du groupe retrouve partout dans le monde son bureau électronique: dossiers, courrier, agenda électronique ... Le premier pas vers l'entreprise virtuelle, pour le spécialiste Denis Ettighoffer (1).
Le vertige informationnel guette toutefois le salarié, reconnaît Didier Lambert, qui estime que la bonne aptitude à travailler en réseau sera l'un des critères de performance de la société de l'intelligence. Au risque de marginaliser les réfractaires...

D) L'exemple d'un réseau local de recherche : la Faculté Technologique de Compiegne

Sur le site de la Faculté, l'Administration, les laboratoires de recherche, et la Faculté elle-même sont reliés par un réseau par satellite

IV) Historique de la recherche documentaire informatisée

A) L'évolution des ordinateurs

Les évolutions technologiques successives de l'informatique furent rapidement intégrées au cas particulier de la recherche documentaire informatisée. Il en fut ainsi de la possibilité de faire travailler l'ordinateur sur plusieurs tâches en même temps (time sharing), et de l'utilisation de moyens de stockage importants des programmes et données des divers utilisateurs avec des temps d'accès courts. L'apparition des disques durs en remplacement des bandes magnétiques a permis l'exploitation de gros fichiers avec un accès direct à l'information. Ces problèmes furent résolus vers le début des années 60 en particulier pour la saisie et la mise au point de programmes informatiques.

(Au niveau de l'organisation des données, c'est l'utilisation des index sous la forme de fichiers inverses qui fut retenue. Elle permet de donner rapidement le nombre de références répondant à une question et ainsi d'orienter la poursuite de l'interrogation. La consultation du fichier des références n'a lieu qu'à la visualisation des informations)

On peut noter que le développement accéléré des banques de données suivit de près le développement de la technologie des ordinateurs. C'est ainsi qu'en 1992 le serveur DIALOG commercialise plus de 450 banques de données représentant près de 2 téraoctets, interrogeables de n'importe quel point du globe à n'importe quelle heure.

B) Le développement des réseaux : les projets

On situe le développement des réseaux avec la lancement par l'Union Soviétique le 4 octobre 1967 du satellite Spoutnik : les Américains décident alors de mettre en place des structures. Les premières liaisons à distance datent des années 60 et utilisaient le réseau téléphonique commuté.

Mais on s'orienta vite vers des réseaux de transport de données propres du fait d'une forte demande résultant du développement du télétraitement, demande elle-même confortée par les besoins des militaires en communication fiable permettant la mise en commun des moyens de calcul. L'idée a consisté à découper et organiser les données en paquets indépendants, accompagnés de l'adresse du destinataire et de données de contrôle.
Contrairement au réseau téléphonique, il est possible de connecter des terminaux fonctionnant à des vitesses différentes.

La recherche documentaire en conversationnel était déjà une réalité, et le développement de tels réseaux a été un renfort puissant à l'essor de l'industrie de l'information. Alors débuta l'ère du "online". On sortait du terrain des pionniers pour entrer dans le domaine commercial. Entre 1964 et 1970, l'Information Scientifique et Technique (IST) se rationnalise, le serveur Dialog et les centres Medlars se développent.

Le premier réseau à transmission de paquets a été développé en 1969 aux Etats-Unis sous contrat de l'agence militaire ARPA (Advanced Research Projects Agency) et reçut le nom d'ARPANET. Il était accessible par ligne téléphonique. Tymshare Corporation, société de service vendant du temps partagé, installa un réseau privé du même type sous le nom de TYMNET qu'elle étendit rapidement hors des Etats-Unis.

Puis, en 1970, c'est le développement des protocoles d'échanges.

Le projet français CYCLADES a été lancé en 1972 et fut opérationnel en 1975. Il reliait une vingtaine d'ordinateurs situés dans des universités, centres de recherche ou centres informatiques, à la fois dans un but d'expérimentation et comme outil d'accès aux banques de données. Il permit le développement du réseau commercial TRANSPAC ouvert en 1978.

Au niveau européen, la CEE développa le projet EURONET engagé en 1975 par les divers PTT. La mise en service en 1980 s'appuyait su un centre de gestion à Londres, quatre centres de commutation à Francfort, Londres, Paris et Rome et cinq autres points d'accès. Depuis l'Europe dispose d'un maillage généralisé.

La première réunion sur l'information en ligne en Europe s'est tenue en 1974 à Bruxelles sous l'égide de l'OTAN. Elle regroupait des spécialistes de la documentation et traitait des problèmes de réseaux pour les bibliothèques et centre de documentation.

La CEE, par l'intermédiaire de la DG Xlll, intervient depuis les années 70 pour stimuler ce secteur au niveau de la Communauté. Ainsi la mise en place de l'infrastructure de base (interconnexion de réseaux type TRANSPAC) a été activée par le projet EURONET-DIANE. Un plan d'action lancé en juillet 88 (IMPACT: Information Market Policy ACTion) vise à la création d'un véritable marché intérieur des services électroniques d'information. Ce plan a été renouvelé en janvier 91 jusqu'en 1995 avec un budget de 100 millions d'écus (INFORMATION MARKET N°66 1 991 ).

Il a quatre objectifs:

  • améliorer la connaissance du marché de l'information
  • dépasser les barrières légales et administratives
  • améliorer l'interface utilisateur/système
  • aider le développement de l'information stratégique.

Un Observatoire du Marché de l'lnformation (OMI) a été créé pour améliorer la compréhension de ce secteur complexe.

Quelques associations à citer :

  • EUSIDIC : Europen Association for Information Service qui depuis 1970 réunit de grands organismes (Questel, l'INIST, le CEDOCAR) afin de mettre en commun des normes et les présenter à l'ISO. Elle rédige également des guides pratiques et organise des conférences. C'est un groupe de pression.
  • EIIA : European Information Industry Association qui réunit les serveurs et producteurs de BDD. Elabore une charte déontologique pour les services télématiques. C'est également un groupe de pression qui un interlocuteur privilégié de l'Union Européenne.
  • ECIA : European Council Information Associations qui réunit 2 représentants de 2 assemblées représentatives de 8 pays européens.

On peut ainsi d'autant plus s'interroger sur la justesse de la politique de l'état français qui s'en est désengagé en 1990 après l'action importante menée par la MIDIST (Mission Interministérielle de l'IST) depuis 1979. La MIDIST a ainsi permis la création et le développement des BDD en France pour faire face à l'influence des BDD américaines : naissance du serveur Questel en 1980 (aujourd'hui Questel-Orbit) Cependant au début de 1991, le Ministère de la Recherche et de la Technologie semblait vouloir redresser la situation. Les efforts importants effectués pour populariser la veille technologique qui s'appuie en grande partie sur les banques de données, sont cependant une réponse positive des acteurs.

C) Le développement des réseaux : quelques repères

C'est dans les années 80 qu'on assiste réellement au développement mondial de réseaux répondant aux besoins de systèmes de communications propres aux instituts de recherche notamment des réseaux locaux, régionaux. Aux Etats-Unis, la National Science Foundation va jouer un rôle important:

  • CSNET : recherche universitaire en informatique
  • BITNET : recherche toute discipline
  • NSFNET est créé en 1984 et joue le rôle d'épine dorsale
  • INTERNET est créé à la même époque.

Les années 1990 annoncent la mise en place aux Etats-Unis du NREN (National Research and Education Network) réseau national à très haut débit (plusieurs gigabits par seconde), s'appuyant sut l'Internet et dont l'un des objectifs est la diffusion massive de services d'informations multimédia. Ce réseau reliera l'ensemble du système éducatif, les bibliothèques, les laboratoires de recherche et les entreprises ; un budget de 1, 15 milliards de dollars sur 5 ans lui est attribué. C'est dire tout l'intérêt que porte le gouvernement américain au développement d'un tel dispositif pour améliorer à terme la compétitivité nationale.

En Europe, c'est également dans les années 80 que se développent dans de nombreux pays les réseaux de communication pour la recherche :

  • JANET en Grande-Bretagne
  • DFN en Allemagne
  • NORDUNET pour la Scandinavie
  • SURFNET aux Pays-Bas
  • EARN raccordé à BITNET en 1984
  • RENATER en France ne démarrera que dans les années 1990.

D'une manière générale, les réseaux de télécommunication ont connu un développement étonnant. Actuellement il s'agit surtout d'offrir l'interconnexion des réseaux locaux avec les réseaux X25 nationaux et internationaux par des voies haut débit, avec des services modernes comme les messageries, le travail coopératif. RENATER, REseau NAtional de TElécommunications pour la Recherche en est l'exemple: il donne accès aux ressources de calcul, aux banques de données, aux catalogues informatisés en temps réel. Sa mise en service est effective depuis 1992.

Le Réseau Numérique à Intégration de Services (RNIS) est une évolution du réseau téléphonique vers le tout numérique véhiculant de bout en bout tous types d'informations numériques: voix, caractères, images, avec des vitesses de transfert élevées (64 kbits/s). Ouvert commercialement fin 87 dans le département des Côtes du Nord, il a été généralisé sur tout le territoire en 1990 sous le nom commercial de NUMERIS. En fait, le RNIS ouvre la porte à une télématique multimédia. Les applications possibles sont nombreuses et on peut prévoir:

  • pour les publics professionnels: les banques de données de photographies de presse, les photographies prises depuis les satellites pour l'agriculture, la météorologie..., mais aussi la documentation technique incluant texte et images ou graphiques,
  • pour le grand public: les catalogues de vente par correspondance, le téléenseignement

Parmi les quelques applications on peut citer:

  • celle de la société pharmaceutique Glaxo reposant sur un système de gestion et d'archivage de documents sur disques optiques numériques consultable par les visiteurs médicaux à distance par NUMERIS.

V) Les grands réseaux de la recherche : RENATER, EBONE JANET, CANARIE, JUNET, INTERNET

A) L'exemple francais : RENATER

Début Juin 1992, les organismes fondateurs de Renater (CEA, CNES, CNRS, EDF, INRIA, Enseignement supérieur) ont créé le réseau RENATER pour interconnecter l'ensemble des établissements d'enseignement supérieur et des centres publics ou privés de recherche, et pour assurer les connexions sur les réseaux de télécommunications pour la recherche ou l'enseignement des autres pays. Ils ont également décidé d'unir leurs moyens au sein du GIP (Groupement d'Intérêts Publics) RENATER et ont confié la mise en oeuvre du réseau à la France Télécom. Cette infrastructure a pour but que la communauté scientifique communique, qu'il y ait échange des publications et du savoir-faire.

1) RENATER, un réseau de réseaux

Le concept du réseau de transport de données de RENATER repose sur une architecture à trois niveaux

  • les réseaux de campus, opérés par les utilisateurs finaux et les centres informatiques, qui relient stations de travail et ordinateurs d'un même site;
  • les réseaux régionaux, qui relient par des points d'accès les réseaux de campus. Les réseaux régionaux permettent aux Campus d'une même région de communiquer entre eux.
  • d'un réseau national d'interconnexion, qui relie les réseaux régionaux. Des liaisons vers les réseaux de la recherche de l'Europe et des Etats-Unis sont raccordées à ce réseau à travers une passerelle internationale. Le réseau national d'interconnexion permet, par l'intermédiaire des réseaux régionaux, à tous les sites reliés à RENATER de communiquer entre eux et d'accéder aux réseaux étrangers.

Après une phase pilote qui a commencé en Octobre 1991, le démarrage opérationnel de RENATER s'est situé en Novembre 1992.

2) RENATER, un réseau à haut débit

La volonté de ses fondateurs est que RENATER possède de puissantes connexions vers les réseaux de la recherche d'autres pays et l'Internet (aujourd'hui 2384 kbit/s vers l'Europe et 1700 vers les Etats-Unis), et aussi qu'il évolue vers les très hauts débits.
L'épine dorsale Paris - Lyon - Marseille - Montpellier est opérationnelle à 34 Mbit/s; les réseaux régionaux raccordés sur cette artère offrent à leurs utilisateurs des débits de raccordement atteignant 34 Mbit/s.
A travers une infrastructure de réseaux régionaux et d'un réseau national d'interconnexion, Renater offre un service de télécommunications. Renater connecte des réseaux locaux des sites et des campus

  • Le service IP
    IP est un protocole de communication par paquets de plus en plus répandu.
    Le service IP de RENATER a pour principales caractéristiques: interconnexion de réseaux locaux de type Ethernet, transport des données, disponibilité, vérification des adresses d'origine, filtrages sur les adresses.
  • Un service de messagerie multiprotocoles
    Parmi les tâches assignées à RENATER par les organismes fondateurs, figure la maîtrise d'ouvrage des services nationaux de messagerie et d'annuaire.

B) Le réseau europeen EBONE et le programme COSINE

Ebone est une fédération de 23 réseaux IP établis en Europe qui se sont regroupés pour établir et financer une infrastructure d'interconnexion et son administration.

EBONE est utilisé pour l'essentiel par les réseaux de la recherche européens; quelques opérateurs de service IP privés y sont également raccordés.

Plus généralement, COSINE (Cooperation for Open Systems Interconnexion in Europe) est un consortium de 18 pays et l'Union Européenne, avec pour but de créer une infrastructure de télécommunication pour l'éducation, le commerce, et l'administration. EuropaNET en sera le résultat et sera similaire à JUNET et Nacsis, les réseaux japonais. Deux originalités :

  1. l'interconnexion des différents réseaux européens grâce à une normalisation des protocoles.
  2. et l'extension de ce réseau aux pays d'Europe de l'Est.

C) L'exemple britannique : le réseau JANET (Joint Academic Network)

JANET a été lancé en 1984 sur une initiative privée, le public visé étant les facultés de médecine britanniques. 40 000 utilisateurs sont ainsi reliés à 1700 ordinateurs sur 150 sites. Le but est de faciliter l'accès aux ressources universitaires grâce à un réseau informatique dans l'intérêt de l'enseignement et de la recherche. Les utilisateurs, à partir d'un site local, peuvent être en relation avec la communauté universitaire nationale et internationale grâce au Packet Switching System, à l'International Packet Switching System et à un certain nombre de réseaux américains. Les services offerts sont la messagerie électronique et des possibilités de communication diverses, et bien sûr 50 catalogues de bibliothèques. De son ordinateur, l'utilisateur peut ainsi faire des recherches et des réservations à distance. Le prêt n'est cependant pas toujours possible selon les bibliothèques. JANET est un réseau très utilisé donc souvent encombré. SUPERJANET, basée sur des fibres optiques se profile déjà à l'horizon : ce sera l'équivalent du NREN network américain. A titre d'exemple : un rapport de 5500 pages pourra être envoyé en 1 seconde d'un site à un autre.

D) L'exemple canadien : CANARIE

Le Canadian Network for the Advancement of Research, Industry and Education (CANARIE) est une autoroute de l'information nationale qui n'a cependant pas été créé par voie législative. Le départ de CANARIE fut le lancement d'une étude de faisabilité en 1989 concernant un réseau de la recherche par un département fédéral : l'ISTC (Industry Science and Technology Canada. Le résultat de l'étude fut positif en termes économiques et techniques.
En 1990, une réunion de la communauté de la recherche, de l'éducation et des représentants du gouvernement conclut à la faisabilité du projet, à l'instar du NREN américain. Ainsi, les dix réseaux provinciaux furent reliés entre eux et offrent les mêmes services que son homologue américain : fourniture de documents électronique, bibliothèque virtuelle, banques de données etc...

E) L'exemple japonais : JUNET

Le Japanese Universities' Network est le plus grand réseau à haut débit au Japon. Il relie les chercheurs japonais entre eux ainsi qu' à l'étranger avec l'interconnexion du réseau aux réseaux européens et nord-américains.
Le National Center for Science Information Systems (NACSIS) est un autre exemple de réseau. Il interconnecte les universités japonaises entre elles grâce au Science Information Network. Son but essentiel est de donner à la communauté de la recherche et de l'éducation le maximum d'accès à l'information. Il propose des services tels que : vidéo-conférence, texte intégral.
Le réseau japonais JUNET est cité en référence par la gouvernement américain.

F) L'exemple americain : Internet

Plus rapides, plus fiables, plus nombreux, les réseaux ont subi des évolutions importantes ces dernières années. Mais la plus marquante pour l'utilisateur est sans doute la mise en commun, le partage de ressources souvent hétérogènes. Dans notre domaine d'intérêt, INTERNET en est un bon exemple.

1) Historique :

INTERNET a été créé par la DARPA (Defense Advanced Research Projects Agency) à la fin des années 60 comme réseau expérimental de partage de données se trouvant sur des ordinateurs distants et de messagerie électronique. Le réseau ARPAnet a éte scindé en deux pour donner Milnet, réseau militaire et NSFnet (National Science Foundation network), réseau de la recherche. Depuis, des centaines d'ordinateurs de par le monde ont été reliés pour donner une collection de réseaux incluant des réseaux régionaux et locaux de nombreuses universités et centres de recherche. En France, INTERNET est accessible par RENATER, le réseau de la recherche en cours d'installation.

2) Les protocoles d'Internet

s'appuie sur un ensemble commun de protocoles de communication (matériels et logiciels) connu sous le sigle TCP/IP (Transmission Control Protocol/lnternet Protocol) proposé par le pionnier d'ARPAnet Robert Kahn et le chercheur Vincent Cerf en 1974. La colonne vertébrale d'INTERNET est constituée de mini-ordinateurs reliés, pour les plus récents, par des cables en fibres optiques offrant des débits de 45 mégabits par seconde. Des centaines d'autres réseaux, réseaux locaux et même des ordinateurs isolés peuvent s'y connecter. Enfin il y a des points d'accès pour des ordinateurs utilisant d'autres protocoles que TCP/IP grâce à des convertisseurs. Le résultat est un métaréseau unique ayant 5 millions d'utilisateurs, sans doute plus. Il est en effet impossible de donner un nombre précis dans la mesure où de grands réseaux reliés à INTERNET sont comptés comme un simple noeud. Son succès est dû à son protocole ouvert (contrairement aux protocoles "maison" des fabricants d'ordinateurs), repris par des dizaines d'industriels intormatiques et par les éditeurs de logiciels.

INTERNET est interconnecté avec nombre d'autres réseaux (13000 de par le monde mais peu en Afrique) incluant le réseau UUCP (Unix-to-Unix Copy Program) qui relie des centaines de milliers d'ordinateurs fonctionnant sous Unix. Un des plus grands réseaux UUCP est EUnet (European Unix Network) qui, depuis 1982, rassemble la communauté de la recherche. Plus de 2500 sites y sont connectés de l'lrlande à la Russie, de la Norvège à la Tunisie. Le taux de croissance d'Internet est de 15 à 20 % par mois.

Comment accéder à Internet ?

Il n'y a pas réellement d'administration centrale à Internet. 2 instances font la coordination :

  • Internet Architecture Board (IAB) pour les adresses
  • Internet Engineering Task Force (IETF) pour les problèmes techniques. A l'heure actuelle, le président est français (INRIA)

Pour être connecté à Internet, il faut posséder une adresse électronique ; celle-ci est attribuée par l'administrateur du système informatique de l'établissement. Exemple d'adresse :
.clpa @ ccr. jussieu.fr.
nom de l'utilisateur @ nom du système. localisation du pays.

L'accès est également possible par des sociétés privées

  • Oléane
  • FNET
  • sur Minitel 36 17 ALTERN

3) Internet et les entreprises :

Plus de cinq millions d'utilisateurs dans le monde, un succès foudroyant aux Etats-Unis, le réseau Internet aborde une phase décisive de sa croissance. Et INTERNET entre en force dans les entreprises.

Plus de cinq millions de micro-ordinateurs répartis dans une centaine de pays, une croissance de 10% par mois, des applications relativement banales mais un potentiel énorme, le plus grand réseau de données du monde aborde une phase décisive de son développement. Sorte de coopérative mondiale regroupant plusieurs milliers de réseaux à vocation scientifique ou universitaire, Internet avec plus d'un million de serveurs (dont 70% rien qu'aux Etats-Unis) interconnectés entre eux au moyen de back-zones nationaux, le rythme de croissance d'Internet est tel que l'ensemble des habitants de la planète devraient être accordés dans moins de dix ans! "Le village global" en quelque sorte...
La raison du succès? Basé sur le principe de la commutation de paquets en mode TCP/IP, l'accès à Internet se fait à partir de n'importe quel terminal relié à un serveur lui-même connecté au réseau. Ce qui est monnaie courante aux Hughes, Apple, Cisco, Walt Disney) l'utilisent pour leurs communications quotidiennes (courrier électronique, transfert de fichiers). Autre élément, la tarification. A peine quelques dizaines de dollars par mois pour un accès à 9, 6 kbit:s permettant de se connecter au monde entier sans limitation de durée ou de volume ("as much as you can eat", comme disent les américains). On peut également accéder à Internet à des débits beaucoup plus élevés mais à des conditions naturellement moins avantageuses (de l'ordre de 20 000 dollars par mois pour un accès à 45 kbit:s), et de 40% dans la communauté scientifique.

4) l'Europe et Internet

En Europe, où l'on recense tout de même près de 300 000 ordinateurs connectés à Internet, seule la comunauté scientifique y a accès dans la dynamique Internet, c'est sans doute son aspect empirique: pas de structure centralisée mais une mosaïque d'intervenants. Rien qu'aux Etats-Unis, l'épine dorsale d'Internet est constituée d'une demi-douzaine de backbones à travers lesquels chacun communique comme bon lui semble. En Europe, ce sont des réseaux dédiés à la recherche comme Renater en France, DFN en RFA ou Janet en Grande-Bretagne qui en constituent l'ossature (baptisée EUNET). Il suffit ensuite à n'importe quel réseau d'être lui-même relié à une infrastructure backbone pour faire partie d'Internet.

5) Les fonctionnalités d'Internet

Ce sont les suivantes:

- La messagerie électronique (le Mail) est certainement la fonction la plus utilisée grâce au protocole SMTP (Simple Mail Transfer Protocol). C'est un moyen simple et économique de communication entre personnes. Il existe aussi un programme présent sur des centaines de machines appelé IRC (Internet Relay Chat) qui permet à tout un chacun d'intervenir dans des conversations en temps réel. C'est "le village électronique". Il permet d'envoyer, de recevoir et d'archiver des messages. 8 millions d'adresses électroniques à l'heure actuelle.

- les librairies électroniques sont de vastes collections de textes ou de programmes en accès libre. L'usager donne l'adresse d'un autre utilisateur et navigue dans les répertoires de fichiers de l'ordinateur hôte jusqu'à ce qu'il trouve l'information ou le programme qui l'intéresse. FTP, le protocole de transfert de fichier, lui permet ensuite de rapatrier à haute vitesse sur son ordinateur les données. C'est le monde du shareware où les programmateurs donnent en essai le fruit de leur travail. Cette conception de mettre en libre accès son travail sans contrepartie financière est, en particulier une des caractéristiques d'INTERNET. C'est un état d'esprit très développé aux Etats-Unis.

- les conférences sont le domaine de Usenet. Créé en 1980 à l'Université de Caroline du Nord, Usenet gère plus de 3000 conférences électroniques sur les sujets les plus variés comme l'information électronique, les CD-ROM en réseau, I'hypertexte etc. Fondés sur des centres d'intérêt communs, des groupes de discussion se forment avec un "éditeur" qui oriente le débat. Le principal problème est d'avoir connaissance des sujets de conférence. INTERNET et Bitnet (réseau universitaire) gèrent des listes de sujets en cours. L'envoi d'un message à une conférence entraîne automatiquement l'ajout de l'auteur à la liste.

- les catalogues de bibliothèques et les banques de données font partie des ressources d'lNTERNET. En juillet 92, on pouvait consulter les OPAC (Online Public Access Catalogs) de plus de 270 bibliothèques universitaires américaines, anglaises, et de quelques pays européens et asiatiques, soit en tout plus de 1000 catalogues. La France révèle ici son grand retard. Depuis 1991, est publié un répertoire des ressources d'lNTERNET pour les Etats-Unis et plus d'une centaine d'OPAC sont signalés. Chaque entrée donne une brève description et les instructions pour y accéder.

De même, par l'intermédiaire de passerelles, il est possible d'interroger des banques de données selon 4 possibilités interessantes dans le domaine de la médecine :

  • BDD bibliographiques : UNCOVER par exemple, revue de sommaires soit 14 000 périodiques et 4 millions de notices avec un service de commande en ligne. C'est un concurrent direct des "Current contents". Pour alimenter UNCOVER, travail coopératif entre bibliothèques.
  • du texte intégral : des grandes oeuvres littéraires, des outils de lexicométrie
  • BDD factuelles quelques grandes BDD en biologie moléculaire:
    • GDB (Genome Database)
    • OMIM (Online Mendelian Inheritance in man)
    • BMBL (séquences nucléodiques)
    • SWISS-PROT (séquences protéïques)
  • l'accès aux grandes serveurs (Dialog, Mead Data, BRS) mais il faut tout de même être abonné pour y accéder. Des licences Medline sont vendues aux campus universitaires pour la mise à disposition sur le réseau des BDD.

Enfin de nombreuses librairies se sont reliées à INTERNET pour permettre la commande en ligne d'ouvrages.

- WAIS pour Wide Area Information Server est le plus connu des projets maintenant opérationnel. WAIS a été développé par les sociétés Apple, Dow Jones et Thinking Machines Corporation avec l'idée d'établir un standard de recherche d'information à travers le réseau INTERNET. Une interface standard disponible pour les systèmes d'exploitation Unix. C'est un système international qui permet à l'usager lui-même d'interroger une bibliographie en langage naturel, grâce à une interface qui retraduit sa recherche en descripteurs.

La société Thinking Machines fabrique des ordinateurs hautement parallèles, bien adaptés à la recherche sur texte intégral. Mais surtout le logiciel effectue une recherche de documents "proches" par rapport à la requête. C'est la technique de "relevance feedback" déjà présente dans le logiciel Spirit. Le but que s'est donné Brewster Kahle est de rendre la recherche documentaire conviviale pour l'utilisateur final. Dow Jones's DowQuest utilise ce système pour balayer plus de 150 000 articles de 185 publications et retrouver les documents pertinents pour la question. C'est un système client-serveur. On compte fin 92 plus de 300 serveurs dans 12 pays, basés sur cette technique et reliés à INTERNET. Cela couvre des domaines d'information très divers de la poésie, au MIT et aux programmes de télévision.

L'interface client est disponible dans le domaine public pour les MACINTOSH, MSDOS, Windows, NeXt et d'autres. Le protocole est une extension de celui développé pour les interrogations de catalogues informatisés de bibliothèques. La recherche a été étendue aux documents formatés, aux feuilles de tableurs, au multimédia, sons et images en mode point liés à un texte. Les données peuvent se trouver sur des machines situées, pourquoi pas, sur plusieurs continents pourvu qu'elles soient accessibles par réseau.

Une session WAIS se décompose en deux phases :

  • l'utilisateur sélectionne une liste de serveurs WAIS,
  • il effectue d'abord une recherche classique par mots clés permettant de repérer des documents pertinents, affichés par ordre de pertinence,
  • ensuite la recherche est lancée à partir du meilleur document, quel que soit sa taille.

Cette technique ne demande qu'une formation légère par rapport aux logiciels d'interrogation classiques. WAIS est toujours en cours d'expérimentation sur INTERNET, mais préfigure ce qui sera possible quand tout un chacun sera relié à un réseau et disposera de machines parallèles sur son bureau.

- GOPHER, développé à l'Université du Minnesota, est un système client-serveur qui retrouve des fichiers sur plusieurs serveurs en utilisant le protocole FTP. Le but est de cacher la complexité des différentes structures de données des fichiers.
Des logiciels plus classiques ont été développés pour l'interrogation des catalogues de bibliothèques.

- NOTIS est un logiciel permettant un accès à plusieurs banques de données gérant des catalogues de bibliothèques. La recherche est classique par combinaison booléenne de différents critères. Mais ensuite, le logiciel lie les notices retrouvées au système de la bibliothèque et permet donc à l'utilisateur de savoir immédiatement si les livres sont disponibles. Le logiciel peut aussi gérer des banques de données commerciales telles MEDLINE, ERIC, Compendex, Current Contents. Dans ce cas les producteurs proposent un coût d'interrogation mensuel fixe.

- TOPIC est un système de gestion, de stockage et de recherche de documents qui offre des capacités de recherche de l'information basées sur des concepts pondérés et d'affichage en fonction de la pertinence. Trois possibilités d'interrogation existent:

  • par mots-clés
  • par combinaison booléenne
  • par recherche par sujet propre à Topic.

Cette dernière est une méthode de recherche permettant de différencier les concepts. En plus d'être un mot, un concept déclenche à l'esprit une famille d'idées et de mots liés à lui.

6) En conclusion sur Internet

- Aujourd'hui, malgré des ressources matérielles impressionnantes, le secteur des serveurs commerciaux présente des limites. La plus visible est l'interface peu conviviale : c'est un monde d'informaticiens qui s'est ouvert à tout le monde. On se retrouve dans la situation qu'ont connu les microordinateurs avec MSDOS. Seuls ceux qui sont prêts à s'investir dans l'apprentissage du langage de commandes bénéficieront de l'information diffusée. Cependant, ela peut évoluer rapidement vu les besoins et de nombreux programmes sont en cours d'écriture pour simplifier l'interaction avec INTERNET. La généralisation de WINDOWS sur compatibles PC devrait ouvrir la porte à des logiciels novateurs. En exemple, le programme Gopher sur station Next permet de naviguer à la recherche d'information sur le réseau aussi facilement que sur un disque dur.

- Une autre limite réside dans la saturation des réseaux submergés par le flot de données à transmettre à travers le monde. Là aussi, de nouvelles technologies apparaissent comme le relais de frame, de nouveaux protocoles haute vitesse tel le standard international SONET (Synchronous Optical Network).

Réservé au début aux chercheurs et scientifiques, INTERNET s'est ouvert dans les années 80 avec une privatisation graduelle et la commercialisation des services. On retrouve ici le même processus que celui noté pour les banques de données et les serveurs. Cela indique une maturité entre l'offre et la demande. La meilleure preuve en est l'apparition de fournisseurs privés de service.

Mais la contribution la plus significative d'lNTERNET est certainement son impact social sur les scientifiques, le monde des chercheurs, les étudiants. Il a permis la création de communautés de personnes "interconnectées". Cela a des conséquences importantes dans le mode de travail et surtout dans le mode de diffusion de l'information. Pour les éditeurs "traditionnels" de bibliographies et de banques de données, cela impliquera sûrement une évolution du métier.

VI) Les enjeux de l'Information Scientifique et Technique (IST) et le rôle des documentalistes

A) Le rôle des bibliothèques scientifiques

L'équipement des bibliothèques scientifiques en nouvelles technologies est très inégal selon les pays et les continents. En France, les CDROM (Medline, PASCAL, Embase) s'implantent progressivement, surtout dans les bibliothèques universitaires et les bibliothèques hospitalières. Ce phénomène va aller en s'amplifiant. Aux Etats-Unis, 60% des bibliothèques médicales sont équipées en CDROM. Une autre technologie de pointe utilisée dans les bibliothèques médicales américaines est la scannérisation et la transmission des images de documents ainsi scannerisés. L'image est envoyée par ligne téléphonique : le receveur doit être équipé d'un logiciel spécifique, d'une imprimante laser et d'un ordinateur. Les bibliothèques utilisent le logiciel ARIEL, développé par The Research Libraries Group, qui compresse ou décompresse les images scannérisées afin de rendre la transmission plus rapide.
Les bibliothèques médicales restent cependant les principales utilisatrices des centres de fourniture de documents.

B) La position des documentalistes

Ce formidable gisement d'informations que constituent les réseaux de communication, les publications électroniques, aux potentialités insoupçonnéçs, ne peut évidemment pas laisser indifférents les professionnels de la documentation même si cela a été construit en dehors d'eux. La recherche d'information en réseau (networked information retrieval: NIR) est un sujet abordé dans la littérature américaine en sciences de l'information et en informatique. De même Tillman écrit qu'il est temps, pour les professionnels de la documentation, de rejoindre le monde de l'information électronique. Et il précise que ce n'est pas seulement une autre technologie à apprendre, mais surtout une pratique sociale nouvelle à intégrer.

C) Les enjeux de l'information scientifique

Plusieurs enjeux se dessinent déjà à la lumière des technologies de pointe telles que les réseaux de télécommunication :

  • le chercheur va avoir accès à des services d'information et à des bibliographies de manière assez élargie. Il faudra donc que le documentalsite lui offre la possibilité de faire un choix parmi ces technologies nouvelles. C'est en quelque sorte, mettre en avant un certain savoir-faire.
  • à l'heure actuelle, le texte intégral peut être transmis grâce à un réseau. Bientôt, ce sera au tour du multimédia : images et sons en mode numérique.
  • les grandes bibliothèques vont donc devoir offrir l'accès aux documents électroniques
  • les bibliothèques et centres de documentation de moyenne importance vont donc passer de l'accès classique à des collections imprimées à celui moins classique de l'information brute comme le texte intégral d'un article, et ce, en temps réel. Cela implique un changement dans leur structure et leur organisation.
  • les relations avec les éditeurs vont donc changer : cela impliquera des royalties à verser par les bibliothèques ou les utilisateurs.
  • les relations avec les utilisateurs vont évoluer : il faudra s'accorder de façon constante à leurs demandes.
  • en tant qu'acteurs de l'information scientifique et technique, les documentalistes doivent s'identifier comme des producteurs et des utilisateurs potentiels de services accessibles sur les réseaux électroniques de la recherche : mise en accès de leur catalogue, diffusion d'une lettre d'information concernant la vie de leur centre (promotions des publications, nouvelles acquisitions, annonces d'expos), aides aux acquisitions, recherches documentaires, aide au catalogage, échanges d'informations.

En conclusion

Autres exemples

Deux projets documentaires expérimentaux existent à l'heure actuelle, TULIP et Red Sage, afin de concrétiser un vieux rêve : à savoir la bibliothèque dans notre bureau. Ces deux projets pilotes résultent d'une collaboration entre des universités américaines et des éditeurs de revues scientifiques, Elsevier et Springer. A titre d'exemple, le projet Red Sage dont le site d'évaluation est l'Université de San Francisco veut offrir à ses utilisateurs la rapidité d'acquisition et la puissance de recherche informatique, tout en recréant l'ambiance d'une bibliothèque. Le chercheur, le médecin, l'étudiant de cette université vont ainsi découvrir un écran similaire au présentoir d'une bibliothèque et il suffit de cliquer sur une revue pour en exminer son sommaire et consulter éventuellement chaque article ; une impression immédiate d'une qualité équivalente à une photocopie de la revue peut se faire sur les imprimantes laser postcript. Le contenu des revues peut égelement être interrogé en texte intégral. Tous ceux qui sont connectés à cette bibliothèque électronique ont accès aux revues dès leur publication. Ces expériences sont utiles pour diverses raisons ; elles montrent, notamment la possibilité de conserver les structures d'information classiques avec évaluation par les pairs, mais dans un contexte d'accessibilité bien plus rapide et aisé aux informations pertinentes ; elles permettent aussi aux éditeurs de tester tous les aspects actuels, techniques et financiers, de ce type de diffusion et d'adapter leurs procédures habituelles au changement d'environnement

Le livre électronique

Le livre scientifique est un autre sujet préoccupant ; en effet, si les livres ont l'avantage d'une approche synthétique et souvent conviviale de la connaissance, les cycles de vieillissement sont de plus en plus courts et s'accordent mal des versions imprimées traditionnelles. Les livres sont aussi mal répertoriés et introuvables. OMIM (Online Mendelian Inheritance in Man), livre vivant dans sa version électronique est une solution exemplaire. Ce livre, existant aussi en version papier, est un guide répertoriant les gènes humains et les maladies associées avec un résumé et des références bibliographiques dont la mise à jour est permanente.

L'évolution de notre société et la complexité des technologies qu'elle utilise ont rendu nécessire l'accès à une information, clé de sa performance, exhaustive, immédiate et indépendante des lieux de sa production et de sa conservation.

Et de fait, une nouvelle pratique sociale est en train de naître. Les chercheurs travaillent de plus en plus en réseau. L'accès immédiat au travail de collègues à l'autre bout de la planète ou la "fréquentation" d'une bibliothèque viruelle de millions d'ouvrages offrent la possibilité d'incorporer un ensemble de connaissances jusqu'ici impensable.

On en arrive donc au concept de bibliothèque virtuelle basée sur le maximum d'accès possibles à l'information, bien plus que sur le concept d'une bibliothèque offrant ses collections sur fiches et catalogues imprimés.

La recherche d'information des années 90

Si les aspects réseau sont déjà remarquables, certains parlent du "village terre", c'est dans le développement de techniques de recherche textuelle qu'il faut chercher le futur de l'informatique documentaire. Il faut bien remarquer que ce domaine est le parent pauvre de la recherche en informatique. Pourtant les besoins sont grands. Le problème principal de la recherche en ligne est de retrouver une information sans trop savoir où elle peut être et par quels moyens la chercher. Les banques de données traditionnelles essaient de lever ces problèmes en structurant fortement les données et en les indexant. Mais cela demande un travail important et coûteux de la part des producteurs. Pour l'utilisateur la formation est indispensable et la recherche d'une même information dans plusieurs banques de données n'est pas très performante. D'autre part l'augmentation des volumes à traiter, le texte intégral exigent plus que le modèle booléen.

Bibliographie

(1) ACCART J.P. L'Accès à l'information spécialisée à l'hôpital : le point de vue des utilisateurs. IFLA Barcelona 1993, booklet 2, 35-37.
BOUCHEIX C. La Communication électronique dans les sciences biomédicales. INSERM Actualités, 1994, jan-fev., n° 122, pp. 12-14.
(2) COLAIANNI L.A. Document delivery : some considerations for the future. IFLA Barcelona 1993, booklet 2, 37-38.
(3) DESCHAMPS C. Les projets ION et EDIL. IFLA Barcelona 1993, booklet 2, 41-43.
(4) CORNISH G.P. UAP : access to documents in the biological and medical sciences. IFLA Barcelona 1993, booklet 2, 39-41.
(5) FLEISH H. The View of an informed user on access to information in the future. IFLA Workshop, Thursday, August 26th 1993.
(6) LUIJENDIJK W.C. Document delivery. IFLA Workshop, Thursday, August 26th 1993.
(7) LUPOVICI C. New technologies for document deliveries at INIST. IFLA Workshop, Thursday, August 26th 1993.

Glossaire

Réseaux
Le terme " autoroute de l'information " désigne un ou des réseaux électroniques dits " large bande ", seuls à même d'assurer la distribution de services audiovisuels, télématiques ou informatiques aux particuliers, entreprises, universités, centres de recherche, hôpitaux , etc.
Connexion
Ces " autoroutes de l'information ", censées relier tous les points d'un pays ou d'une région, ne reposent pas tant sur la mise en place de réseaux à haut débit, qui existent déjà, que sur la mise en place, au niveau de l'utilisateur final, d'une connexion physique, fibre optique ou câble coaxial, lui donnant accès à ces réseaux large bande. L'installation d'une connexion de ce type prendra plusieurs années et nécessitera des modifications substantielles des réseaux câblés et des réseaux téléphoniques.
IP
protocole utilisé pour le transport des données dans Internet. Les données à expédier sont segmentées en "paquets".
Chaque paquet possède un en-tête qui comprend l'adresse de la machine destinatrice, l'adresse de la machine réceptrice, et des informations pour le contrôle d'erreurs, la numérotation des paquets, etc. La machine réceptrice qui reçoit les paquets, reconstitue les données et les délivre à l'application informatique, ou à l'utilisateur final.
Chaque système informatique (intelligent) relié à l'Internet doit être enregisté et possède une adresse qui lui est unique au monde.
TCP
protocole, au-dessus d'IP, permettant d'assurer le contrôle d'erreurs de bout en bout, de garantir la mise en ordre de paquets éventuellement reçus dans le désordre, etc.
Il faut en effet noter que deux paquets IP consécutifs peuvent emprunter un chemin différent!
X25
protocole de transport de données, en général utilisé par des réseaux, publics comme Transpac, Infonet, PSS (Angleterre), etc.
C'est un protocole basé sur le concept de circuit virtuel. Tout échange de données entre deux machines, donne lieu à l'établissement d'un circuitvirtuel. Lors de l'échange des données, les adresses des deux systèmes ne sont échangées qu'une seule fois, contrairement à la technique IP.
Les données empruntent toujours le même chemin virtuel lors d'une session.
X400, X500
normes ou protocoles de communications entre équipements
MULTIMEDIA
un système multimédia intègre des données informatiques, des sons, des images, fixes ou animées, du texte. Ces différents composants peuvent être gérés simultanément et nécessitent pour leur consultation un voire plusieurs appareil de lecture spécifiques : ex : micro-ordinateur + lecteur vidéodisque.
OPAC (online Public Access Catalog)
sigle anglo-saxon désignant les catalogues électroniques des bibliothèques
PASSERELLE (ou gateway)
unité fonctionnelle permettant de connecter des réseaux d'ordinateurs intialement non compatibles (réseaux à architecture différente)
PROTOCOLE
ensemble de règles qui détermine des actions spécifiques en général des communications entre ordinateurs (ex X25, X400, X500, TCP/IP)
CCITT
Consultative Committee on International Telephone and Telegraph. Organisation internationale chargée de développer des standards communs.
DEBIT
quantité d'informations (bits) transportées par unité de temps. Mesurée en bits par secondes (bps). Le réseau du débit numérique RNIS atteint 64 kbps.
EDI
Electronic Data Interchange. Service d'échanges de données électroniques qui remplace les documents papier.
INTERNET
banque de données et messagerie américaine qui comprend actuellement 20 millions d'abonnés.
LAN
Local Area Network, réseau spécifique à une entreprise qui permet de connecter entre eux des équipements. Le WAN (Wide Area Network) est plus étendu et concerne des entreprises multisites.
RENATER
Réseau à haut débit déployé par France Télécom pour relier les universités et centres de recherche français. Relié à RENATER.
RNIS
Réseau numérique à intégration de services . Réseau public numérique (Numéris) qui permet la transmission (à 64 kbps) de voix, données et images)

Notes

(1) "L'Entreprise virtuelle, ou les nouveaux modes de travail" de Denis Ettighoffer, Odile Jacob, 346 pages, 1992.

cop. JP Accart, 2007

Abonnement

Recevez chaque mois par mail l'Edito et les mises à jour du site.