Couverture de SR_046

Article de revue

Les chantiers du numérique à la BnF (1990-2018)

Pages 191 à 200

Notes

1Afin de mieux comprendre l’actualité de la numérisation à la BnF, le 9 juillet 2018 nous avons rencontré Laurent Duplouy [1]. Une rencontre placée à la fois sous le signe de l’histoire d’une politique, d’une réflexion sur les enjeux actuels et des perspectives possibles.

La numérisation inscrite dans le projet initial

2Le 14 juillet 1988, François Mitterrand lance sur TF1 le projet d’une nouvelle bibliothèque, bientôt surnommée « TGB », qui se concrétise par le lancement d’un concours architectural, remporté par Dominique Perrault et la création de l’Établissement public de la bibliothèque de France (EPBF). Il déclare :

3

Je veux que soient entrepris la construction et l’aménagement de l’une des ou de la plus grande et de la plus moderne bibliothèque du monde. […]
Je veux une bibliothèque qui puisse prendre en compte toutes les données du savoir dans toutes les disciplines, et surtout, qui puisse communiquer ce savoir à l’ensemble de ceux qui cherchent, ceux qui étudient, de ceux qui ont besoin d’apprendre, toutes les universités, les lycées, tous les chercheurs qui doivent trouver un appareil modernisé, informatisé et avoir immédiatement le renseignement qu’ils cherchent. On pourra connecter cette bibliothèque nationale avec l’ensemble des grandes universités de l’Europe et nous aurons alors un instrument de recherche et de travail qui sera incomparable. J’en ai l’ambition et je le ferai [2].

4Dans un contexte marqué par l’essor de l’internet et ses promesses, on s’interrogeait sur l’équilibre au sein de la future bibliothèque entre les collections papier et les collections numériques. Les premiers projets entendaient donner toute leur place aux collections papier mais certains, sous l’impulsion du conseiller du président de la République, Jacques Attali, n’hésitaient pas à rêver d’une bibliothèque virtuelle, « d’un genre nouveau » sans murs, ouvrant les portes d’un vaste réseau. L’année 1994 voyait la naissance de la Bibliothèque nationale de France, issue de la fusion de la Bibliothèque nationale et de l’Établissement public de la Bibliothèque de France

5 Le département de la bibliothèque numérique dirigé par Catherine Lupovici impulsait la numérisation au sein des différents départements de la bibliothèque nationale. Il ne s’agissait pas de construire une « bibliothèque dans la bibliothèque », mais de disséminer le numérique et l’innovation dans l’ensemble de l’établissement. La numérisation des collections était considérée comme une mission à valeur patrimoniale dont le département de la conservation avait la charge. Celui-ci suivait l’ordre des priorités indiquées par la direction des collections en fonction de la politique documentaire de la BnF. Les documents en péril étaient prioritaires, mais il s’agissait également de rendre accessibles aussi bien des classiques comme les Misérables que des documents méconnus.

6 À la fin de l’année 1997, Gallica ouvrait ses portes au public virtuel du web. Elle proposait alors l’accès à quelques milliers de textes accessibles uniquement en mode image.

Une série d’étapes

7Depuis cette époque fondatrice, de nouvelles étapes ont été franchies [3]. En 2000, les collections numérisées sont devenues accessibles en mode texte avec une nouvelle version de Gallica. En 2004, la première charte documentaire précisait cette évolution des collections : les quelque 100 000 documents imprimés, 80 000 images et trente heures de son disponibles dans Gallica s’inscrivaient dans une dominante disciplinaire en histoire, littérature, sciences et techniques. Majoritairement francophones, ces ressources libres de droits proposaient une large variété de supports (livres, revues, journaux, partitions, estampes, cartes, photographies, enregistrements sonores), allant de l’Antiquité à la première moitié du xxe siècle, avec une forte présence de documents publiés au xixe siècle. Le programme de numérisation de la presse nationale et régionale débutait en 2005. Il progresse depuis lors en fonction de la durée des droits (70 ans [4]) et de négociations avec des ayants droit qui désirent verser leurs collections.

8Organisé autour de corpus significatifs et de programmes de numérisation ambitieux, l’accroissement des collections numériques s’appuie également sur des partenariats avec d’autres bibliothèques. Parallèlement, l’évolution des logiciels de reconnaissance optique de caractères permet d’offrir de plus en plus de documents en mode image et en mode texte [5].

9La numérisation n’est donc pas une affaire récente à la Bibliothèque nationale de France. Dès 2011, un premier marché aboutissait à la numérisation de 410 000 documents mobilisant pas moins de 600 personnes. Un intérêt particulier était porté à la chaîne de travail. Les maîtres-mots étaient alors « qualité » et « fluidité » [6].

10 D’abord vue comme un remarquable moyen de conservation, de communication et de recherche, la numérisation fait l’objet d’autres types d’enjeux. Il peut s’agir de la valorisation des collections, voire de celle de l’institution. Gallica, la bibliothèque numérique de la BnF apparaissant comme un véritable outil de promotion institutionnelle, située à la hauteur des grandes bibliothèques mondiales (Harvard, British Library…). Ainsi, la BnF œuvre avec l’ensemble des bibliothèques nationales européennes et avec les éditeurs à l’édification d’Europeana, la bibliothèque numérique européenne qui permet d’accéder, via internet, à plusieurs millions de documents numérisés représentatifs du patrimoine historique et culturel de l’Europe. Le contenu de Gallica est pour cela régulièrement moissonné par Europeana.

11 Un autre enjeu majeur réside dans le souci de « modernisation du service public [7] ». Dans ces conditions, l’on comprend comment, d’une part, le débat sur le choix de la version du document à numériser (original ou copie) semble dépassé ; de l’autre, pourquoi les discussions se concentrent davantage aujourd’hui sur les usages. Aussi les campagnes systématiques de numérisation sont-elles pensées non seulement à destination des chercheurs, mais aussi d’un plus vaste public [8], celui des « gallicanautes [9] ».

Ill. 1 – Capture d’écran, du portail Gallica, BnF (10 septembre 2018)

Ill. 1 – Capture d’écran, du portail Gallica, BnF (10 septembre 2018)

Ill. 1 – Capture d’écran, du portail Gallica, BnF (10 septembre 2018)

12 Il n’en demeure pas moins que le système est complexe et cloisonné. À un portail Gallica gratuit et consultable de l’extérieur de la BnF s’ajoute, depuis 2012, Gallica intra muros qui rassemble des documents numérisés encore sous droit… Ceux-ci sont signalés sur le site Gallica par la mention « consultable sur place ». Gallica intra muros ne peut être consulté que dans l’enceinte de la BnF au sein des bibliothèques de haut-de-jardin et du rez-de-jardin [10]. Il existe également un accès payant à 100 000 documents numérisés sous droits [11].

13 Gallica « marque blanche » est un dispositif de « coopération numérique » mis en place par la BnF qui fait bénéficier ses partenaires en France et à l’international de son infrastructure. La BnF accroît par ce biais ses collections en intégrant de nouveaux documents numérisés. Chaque nouvelle bibliothèque numérique est signalée, paramétrée, selon le souhait et les « couleurs » du partenaire qui conserve ainsi son identité [12]. La bibliothèque numérique de la Bibliothèque nationale et universitaire de Strasbourg, Numistral[13] fonctionne selon ces principes.

14 Ainsi, quand bien même les enjeux relatifs à la numérisation – lier politique documentaire et préoccupations techniques – n’ont pas changé, sa place et ses usages ont subi de profondes transformations.

Qui s’occupe de numérisation ?

15Pour comprendre encore plus finement la place occupée par la numérisation à la BnF, on peut se tourner vers l’organigramme de l’institution, divisée en trois grandes directions : la direction de l’administration et du personnel, la direction des collections, la direction des services et réseaux. Cette dernière, dédiée aux fonctions support, apparaît centrale pour les opérations de numérisation [14]. En son sein, le département de la conservation comporte un service qui leur est dédié, un service de la numérisation en charge des campagnes… Cependant, la direction des collections [15] occupe une place déterminante au plan scientifique. C’est vers elle, en effet, qu’il convient de se tourner pour observer la manière dont s’échafaudent les choix. En son cœur s’élabore la politique documentaire qui obéit, en matière de numérisation, à des objectifs à la fois quantitatifs et qualitatifs. Le tout est validé par le conseil scientifique. Deux constats peuvent être faits à ce stade : les décisions relèvent de la collégialité ; le pouvoir des conservateurs s’avère déterminant. Si chacun des départements doit avoir sa place dans le train des opérations, les hiérarchies symboliques, et implicites, ne sont jamais bien loin. Ainsi, la réserve, les départements des manuscrits ou des estampes – les plus emblématiques –, y figurent tout en haut.

16Aussi, quand bien même le cœur de la mission de la direction des services et réseaux relève de la question des supports et des métadonnées, la stratégie d’ensemble échoit davantage à la direction des collections, qui demeure souveraine en matière de conservation. Ainsi, le responsable de la numérisation n’est-il pas nécessairement le responsable de la conservation. Dans ce cadre institutionnel, il n’est pas indifférent que Laurent Duplouy soit passé d’une direction à une autre.

17Le tout obéit à une lourde succession d’opérations, formidablement résumée en croquis par Pierre-Yves Cachard, conservateur général des bibliothèques, inspecteur général des bibliothèques. L’un des croquis met l’accent sur le projet CORPUS, destiné à fournir des corpus numériques à des fins de recherche [16].

Ill. 2 – Le projet CORPUS dédié aux chercheurs

Ill. 2 – Le projet CORPUS dédié aux chercheurs

Ill. 2 – Le projet CORPUS dédié aux chercheurs

Croquis de Pierre-Yves Cachard.

18 Où l’on voit que le processus est appréhendé selon une triple approche : le dialogue entre chercheurs et bibliothécaires, les enjeux organisationnels, la question du « devenir en ligne du patrimoine numérisé ».

Supports, partenariats et externalisation

19Les années passant, les supports de numérisation ont subi de profondes transformations. À une numérisation en deux dimensions destinées aux écrits et images fixes s’est ajoutée celle d’images animées, en trois dimensions, et de fonds sonores. Déclinée à la BnF, la numérisation concerne ainsi des livres, des images, mais également des objets numérisés en 3D, pour l’instant à titre expérimental [17].

20 Parmi les opérations remarquables, peut être citée celle réalisée à l’initiative du département des cartes et plans de documents de la Société de géographie. Née en 1821, destinée à faire progresser la géographie et à encourager les voyages de découverte lointains, elle avait développé un fonds alimenté par des récits de voyage, des revues, des cartes et des atlas, des notes et carnets d’explorateurs. Quelques 145 000 photographies prises entre 1850 et 1950 le composent. En cours depuis 2007, la numérisation de ce fonds enrichit de plusieurs milliers de documents chaque année Gallica et Gallica intra muros [18].

21 Les opérations, majoritairement externalisées, sont de plus en plus réalisées dans le cadre d’appels à projets, en forte augmentation, et de partenariats multiples. Les partenariats public-privé ont alimenté en leur temps de nombreux débats dans les milieux concernés, certains décelant dans ces opérations une aliénation du patrimoine national [19]. Le recours à des sociétés de prestataires de services – le pourcentage atteint aujourd’hui 70 % – continue d’ailleurs de provoquer quelques réticences à l’intérieur même de l’institution. En 2012, a été créée une filiale de la BnF, « BnF Partenariats » qui a permis à la BnF d’émarger aux financements des investissements d’avenir. Dans ce cadre le projet ProQuest a été dédié aux Early European Books piloté par la BnF, consacré aux livres imprimés en Europe avant 1701, sans distinction de langue, et hors d’Europe dans des langues européennes [20].

22Reprenant et complétant Early English Books Online (EEBO), le projet porte surtout sur des documents non anglophones, même si les ouvrages rédigés en anglais ou imprimés dans le monde anglophone répertoriés dans EEBO y sont également inclus. Il s’agit de fac-similés en couleur et haute résolution réalisés à partir de sources imprimées originales. Voici les éléments d’explication fournis par ses promoteurs :

23

Chaque élément de la collection est numérisé dans son intégralité, y compris les reliures, les bords, les pages de garde, les pages vierges et les éventuels encarts volants afin d’offrir une mine d’informations sur les caractéristiques physiques et la provenance des originaux. Chaque jeu d’images de document s’accompagne de métadonnées bibliographiques détaillées afin de favoriser la consultation et la recherche des fac-similés. Les utilisateurs d’Early European Books disposent également d’une fonctionnalité leur permettant de repérer des images particulières contenant des annotations manuscrites et divers éléments imprimés non textuels, comme des illustrations et des cartes [21].

24 Le projet est divisé en grandes collections. La 6 est la première collection dédiée à des ouvrages de la Bibliothèque nationale de France. Composée de plus de 3 500 œuvres, elle comporte des ouvrages en français, mais aussi des traductions d’œuvres littéraires écrites en anglais, espagnol, italien, néerlandais et allemand. Sur la toile, y est résumé son contenu :

25

Témoin de l’intérêt porté aux textes classiques à la Renaissance, la collection 6 compte plusieurs éditions d’Homère, Hérodote, Platon et Aristote, mais aussi de Virgile, Horace, Ovide, Cicéron et Jules César. En matière de textes français contemporains, la philosophie est représentée par des écrits de Pascal et Descartes, notamment, et parmi les œuvres littéraires figurent Les Fables de La Fontaine. Plusieurs ouvrages religieux sont proposés […]. La collection comprend également des textes en latin écrits par les Italiens Giordano Bruno, condamné pour hérésie, et Savonarole, prédicateur exalté. L’intérêt pour les sciences, la médecine et l’alchimie est représenté par une version de La Toyson d’Or de Salomon Trismosin, agrémentée d’illustrations riches en couleurs (Paris, 1613), ainsi que les traductions françaises des écrits d’Hermès Trismégiste et du Dictionnaire hermétique de William Salmon. Au côté de nombreux textes décrivant les coutumes et le folklore des régions de France, plusieurs ouvrages relatent la découverte et l’exploration du monde […]. D’autres ouvrages dans les domaines des mathématiques, de l’astronomie, de la politique, des arts guerriers, de l’agriculture, de la fauconnerie et de la culture des tulipes, ainsi qu’une traduction française du livre de Ruy López de Segura sur le jeu d’échecs, viennent compléter cette riche collection (extraits) [22].

26 Financé selon ce même mode, le site de presse de la BnF Retronews [23] propose d’accéder à « trois siècles de presse en ligne ». À la différence de la partie de Gallica consacrée à la presse et aux revues en version intégrale de 1631 à 1945, les extraits de presse proposés par Retronews sont éditorialisés ; le site auquel on peut s’abonner, met, de plus, à disposition des outils d’analyse sémantique des textes [24] qui autorisent les recherches sur les lieux, les événements, les chronologies.

27 La numérisation est donc un bon moyen d’appréhender l’évolution de la politique de conservation et de valorisation de la BnF, et plus largement, celle d’une institution de service public. Le souci d’élargir les publics et d’étendre les usages comme la volonté de multiplier les campagnes semblent remarquables. Ces deux orientations relèvent de la recherche constante, par-delà les divergences, d’un équilibre entre la gestion des ressources, l’amélioration des compétences et la volonté de mettre à disposition un éventail des savoirs le plus large possible.


Mots-clés éditeurs : conservation du patrimoine, bibliothèque, valorisation du patrimoine, Gallica, service public, numérisation, Bibliothèque nationale de France

Logo cc-by-nc-nd

Date de mise en ligne : 14/11/2018

https://doi.org/10.3917/sr.046.0191

Notes

Domaines

Sciences Humaines et Sociales

Sciences, techniques et médecine

Droit et Administration

bb.footer.alt.logo.cairn

Cairn.info, plateforme de référence pour les publications scientifiques francophones, vise à favoriser la découverte d’une recherche de qualité tout en cultivant l’indépendance et la diversité des acteurs de l’écosystème du savoir.

Retrouvez Cairn.info sur

Avec le soutien de

18.97.14.81

Accès institutions

Rechercher

Toutes les institutions