Conserver et diffuser le patrimoine sonore kabyle de l’immigration : l’apport des métadonnées METS
- Par Sabine Loupien
Pages 85 à 107
Citer cet article
- LOUPIEN, Sabine,
- Loupien, Sabine.
- Loupien, S.
https://doi.org/10.3917/edb.031.0085
Citer cet article
- Loupien, S.
- Loupien, Sabine.
- LOUPIEN, Sabine,
https://doi.org/10.3917/edb.031.0085
Notes
-
[1]
On désigne par interopérabilité la possibilité d’échanger des fichiers avec d’autres utilisateurs équipés de matériels ou de logiciels différents. Pour garantir l’interopérabilité, il faut veiller à utiliser des formats de fichiers ouverts, c’est-à-dire dont les spécifications sont connues et accessibles à tous.
-
[2]
Les métadonnées, données sur les données, permettent à la fois de décrire, d’organiser et d’accéder à l’information numérique. Très diverses, du Dublin Core à l’Encoded Archival Description (EAD) en passant par les métadonnées Learning Object Metadata (LOM) pour décrire les ressources de l’enseignement jusqu’aux métadonnées Moving Picture Experts Group (MPEG) pour les documents audiovisuels, orientées et recommandées selon leur usage, ces dernières ont une fonction essentielle dans le monde de la conservation et de l’information. Elles répondent à des protocoles d’échange des documents sur le Web ainsi qu’à des impératifs d’interopérabilité.
-
[3]
L’IASA favorise depuis 1969 la coopération internationale entre détenteurs de documents sonores et audiovisuels. Les aspects techniques et pratiques de la conservation des corpus sonores ainsi que les questions relatives à l’enregistrement et à la diffusion des documents audiovisuels sont abordés et diffusés par cet organisme affilié à l’UNESCO.
-
[4]
Membre de l’IFLA, l’AIBM est une association professionnelle regroupant plus de 2 000 membres : établissements conservant les grandes collections musicales ou professionnels de l’information et de la documentation.
-
[5]
Les normes validées et publiées par un organisme qualifié sur le plan régional, national ou international sont des spécifications techniques établies par consensus. Dans le domaine bibliothé-conomique, elles s’appliquent tant à la conservation, à l’organisation et à la diffusion des collections qu’à leur description.
-
[6]
Le CCSDS est un groupe international formé par plusieurs agences spatiales. Il a pour fonction de développer des standards et de faire des recommandations dans le domaine des données scientifiques et techniques. Pour une explication détaillée du modèle OAIS voir CCSDS. Modèle de référence pour un Système ouvert d’archivage d’information (OAIS). Washington, D.C., CCSDS Secretariat, mars 2005. CCSDS 650.0B-1 (F).
- [7]
-
[8]
Certaines informations figurant dans cet article ont été aimablement communiquées par Alain Carou et Pascal Cordereix, conservateurs au Département de l’audiovisuel de la Bibliothèque nationale de France.
-
[9]
Se reporter à la communication d’Emmanuelle Bermes, Isabelle Dussert Carbone, Thomas Ledoux et al. La préservation numérique à la Bibliothèque nationale de France : présentation technique et organisationnelle. In 74e congrès IFLA, Bibliothèques sans frontières : naviguer vers une compréhension globale, 10-14 August 2008, Québec.
-
[10]
On entend par langues de France les langues régionales ou minoritaires (alsacien, arménien occidental, basque, berbère, breton, gascon, judéo-espagnol, romani, wallisien, wayana, etc.) parlées sur le territoire français depuis assez longtemps pour faire partie du patrimoine culturel national. N’entrent pas dans cette dénomination les langues officielles d’État.
-
[11]
Consultative Commitee for Space Data Systems (CCSDS), op. cit., section 4, modèle fonctionnel, p. 4.1.
-
[12]
On distingue trois catégories de paquets d’informations : le paquet d’informations livré par le producteur et à verser dans l’archive OAIS (Submission Information Package – SIP), le paquet d’informations archivé (Archival Information Package – AIP) et le paquet d’informations diffusé aux utilisateurs (Dissemination Information Package – DIP).
-
[13]
Consultative Commitee for Space Data Systems (CCSDS), op. cit., p. 4.39.
-
[14]
Pour l’OAIS, un Objet-données est un objet physique (fiche documentaire, photographie, disque 78 tours) ou un objet numérique (séquences de bits).
-
[15]
L’information d’empaquetage relie et identifie les composants d’un paquet d’informations. Le Système de Préservation et d’Archivage Réparti (SPAR), exploitée par la Bibliothèque nationale de France, utilise METS pour empaqueter les différentes métadonnées des ressources numériques.
-
[16]
Les identifiants pérennes ont une syntaxe commune : l’Uniform Resource Identifier (URI), fondée sur une spécification du W3C. Ils assurent l’identification unique des ressources numériques ainsi que la pérennité et l’interopérabilité des adresses.
-
[17]
Sous l’égide de la Digital Library Federation, le projet MOA-2 s’est consacré à l’élaboration de métadonnées d’objets numériques pour l’encodage, la recherche, l’affichage et la navigation.
-
[18]
Le langage XML est devenu un standard en 1998. Issu de la norme Standard Generalized Markup Language (SGML), XML favorise l’organisation des éléments et de leur sémantique. Il sert de fondement pour créer des langages balisés spécialisés tels les langages Metadata Object Description Schema (MODS), Metadata Encoding and Transmission Standard (METS), Resource Description Framework (RDF) ou encore Really Simple Syndication (RSS).
-
[19]
Les sept sections METS sont les suivantes : 1- l’en-tête ou « Mets Header » ; 2- les métadonnées descriptives ou « Descriptive Metadata Section » ; 3- les métadonnées administratives ou « Administrative Metadata Section » ; 4- la liste des fichiers qui composent l’objet numérique : « File Section » ; 5- la carte de structure ou « Structural Map Section » ; 6- les liens entre les éléments de la carte de structure : « Structural Link section » ; 7- « Behavior Section » qui recense les programmes et les logiciels nécessaires au bon fonctionnement de l’objet conservé.
-
[20]
Un objet simple présente un niveau de structure simple alors que les objets complexes comptent plusieurs échelles d’accès. Ces échelles ou hauteurs d’accès sont appelées granularités. Ainsi, l’objet complexe « collection » peut comporter plusieurs niveaux de granularité : le document, le volume, le tome, la page puis la vue de détail de la page.
-
[21]
Dans le cadre du XML Pointer Language, un système de pointage interne relie les fichiers et les métadonnées d’un document METS. Dans l’exemple ci-dessus, le pointer area viserait un sous-segment du fichier c’est-à-dire un détail de la pochette.
-
[22]
Le format Dublin Core (DC) permet une description minimale des ressources documentaires et s’appuie sur un consensus terminologique et sémantique. Quinze éléments permettent d’identifier et de décrire l’information.
-
[23]
L’Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) est un protocole d’interrogation et d’échange de métadonnées fondé sur le langage XML et le format Dublin Core. Il fonctionne par moissonnage régulier d’entrepôts de données structurés et organisés par chaque institution ; seules les métadonnées documentaires des catalogues OAI sont moissonnées.
-
[24]
À l’instar du projet de Bibliothèque numérique berbère, la plate-forme collaborative Telemeta est soutenu par le programme « Anthroponet » et le TGE-Adonis. Cet outil prototype est aujourd’hui visible sur le site du Centre de recherche en ethnomusicologie permet de décrire, de conserver et de diffuser les archives sonores de la recherche ainsi que la documentation relative au patrimoine musical.
-
[25]
Le Portail du patrimoine oral lancé par le pôle associé BnF/Fédération des Associations de Musiques et Danses Traditionnelles (FAMDT) a pour objectif de diffuser les archives sonores de plusieurs centres de ressources. Citons notamment le Centre d’Études, de Recherche et de Documentation sur l’Oralité (CERDO), le Centre Occitan des Musiques et Danses Traditionnelles Toulouse Midi-Pyrénées (COMDT), l’association Dastum, centre de musiques et danses traditionnelles en Bretagne, la Maison du patrimoine oral en Morvan, et la phonothèque de la Maison Méditerranéenne des Sciences de l’Homme (MMSH) d’Aix-en-Provence.
-
[26]
Première collecte institutionnelle d’enregistrements sonores en France, les Archives de la parole sont fondées en 1911 par Ferdinand Brunot au sein de l’Université de Paris. Ce fonds célèbre compte à la fois des enregistrements des contemporains du linguiste, tel Guillaume Apollinaire, mais également « les voix et témoignages des parlers régionaux » collectés en 1912 et 1913 dans les Ardennes, le Berry et le Limousin. Conservé par le Département de l’audiovisuel de la BnF, il est composé d’enregistrements fixés sur support de cire puis pressés sur disque 78 tours à saphir, de fiches documentaires et d’archives administratives. Fiches et archives administratives ont été constituées par le linguiste et ses collaborateurs afin d’organiser les missions et faciliter l’analyse ultérieure du corpus.
-
[27]
Un dispositif de pointage interne au document METS est assuré par des filepointer METS : – fileId pointe d’une division vers l’ensemble du fichier, – seq pointe d’une division vers un lot de fichiers et indique un ordre de défilement séquentiel, – par permet une lecture en parallèle des fichiers, – area pointe vers un segment ou un sous-segment du fichier. À cela s’ajoute metspointer (externe) qui vise un autre fichier METS et relie plusieurs documents METS entre eux, et l’élement mdRef qui, associé à la syntaxe XML Linking Language, désigne des métadonnées qui se trouvent en dehors du schéma METS (bases de données, entrepôts externes). Les éléments DMDID et AMDID attribuent un identifiant aux sections <dmdSec> et <amdSec>.
-
[28]
La Bibliothèque nationale de France a retenu pour l’organisation de ses collections, quatre niveaux de granularité : – « set » (niveau supérieur) rassemble les collections d’objets numériques, le titre d’un périodique ou un document multimédia, – « group » (niveau de l’objet numérique) réunit notamment une monographie, un numéro de périodique, un film – « object » (troisième niveau) correspond à une partie de l’objet numérique (page web, page d’un livre, piste d’un CD audio, image) – « file » (Objet-données) – au niveau le plus bas –, désigne un fichier numérique ou un flux de bits.
-
[29]
Nous avons travaillé particulièrement à partir des boîtes d’archives cotées DAV 15 et DAV 16, conservées au Département de l’audiovisuel de la BnF, et consacrées aux enregistrements de l’Exposition coloniale.
-
[30]
Pour une présentation du fonds de l’Exposition coloniale voir l’article de Pascal Cordereix. Les enregistrements du musée de la Parole et du Geste à l’Exposition coloniale. Entre science, propagande et commerce. Vingtième siècle 2006/4, no 92, pp. 47-59.
-
[31]
Le CREM est attaché au Laboratoire d’ethnologie et de sociologie comparative (UMR 7186) du CNRS, il a la responsabilité du fonds de l’Exposition coloniale conservé dès son ouverture en 1932, par la phonothèque du Musée d’Ethnographie du Trocadéro (MET) puis au Musée de l’Homme, à partir de 1937. Depuis la fermeture pour rénovation du Musée de l’Homme en 2009, ce fonds est consultable à la bibliothèque centrale du Muséum National d’Histoire Naturelle (MNHN) et à la Bibliothèque nationale de France, site François-Mitterrand.
-
[32]
Il s’agit de notations musicales pour la collecte de musiques non occidentales. Un document de travail de quelques feuillets intitulé « Signes spéciaux » (conservé au Musée Guimet) fut réalisé à l’intention des musicologues collaborateurs de la collection « Bibliothèque musicale ».
-
[33]
À partir de 1930, Philippe Stern, conservateur au musée Guimet et attaché au Musée de la Parole et du Geste, assure après le départ d’Hubert Pernot, directeur de l’Institut de phonétique de l’université de Paris de 1924 à 1930, la direction de la collecte des enregistrements de l’Exposition coloniale.
-
[34]
Dans sa monographie de l’École du Louvre, Les enregistrements de l’Exposition Coloniale Internationale de 1931 : genèse et préservation, Aude Berthomier rappelle l’organisation de conférences musicales au Musée Guimet en collaboration avec le Musée de la Parole. Le 25 novembre 1934, en introduction au cycle, Mady Humbert-Lavergne présente l’Exposition coloniale dans la conférence « Voix lointaines. Continuation du rapide voyage à travers les musiques de l’Asie, l’Afrique et l’Océanie ».
-
[35]
Plus précisément, dans une brochure conservée dans les archives musicales du musée Guimet intitulée Indications destinées à ceux qui cherchent à recueillir des chants populaires, Philippe Stern livre une méthode de collecte des enregistrements de l’Exposition coloniale. Il recommande ainsi une illustration photographique des enregistrements selon des angles et des sujets précis, photographies de groupe « ensemble des musiciens », photographies par musicien, par instrument, ainsi que « des photographies des gestes accompagnant le chant » et des « mains du musicien en train de jouer ».
-
[36]
La section musicale du Musée Guimet est créée en 1932. Dès 1927, une nouvelle collection la « Bibliothèque musicale », est lancée par le Musée Guimet et le Musée de la Parole sous la direction de Philippe Stern. Elle fait l’objet d’un contrat – conservé au musée Guimet – entre l’éditeur Paul Geuthner, Hubert Pernot et Philippe Stern. Entre 1929 et 1932, plusieurs volumes recensés dans la « liste des éditions de la Bibliothèque musicale » sont publiés.
-
[37]
Il s’agit du catalogue Quelques disques à aiguille de Madagascar et de la Côte des Somalis commercialisé par Pathé. Il recense une faible part, dix 78 tours, des enregistrements de l’Exposition.
-
[38]
Pièces relatives au transport des soldats d’Afrique du Nord, d’Afrique occidentale et équatoriale françaises des camps de Nogent-sur-Marne et de Saint-Maur où ils cantonnaient vers les studios d’enregistrement parisiens Pathé.
-
[39]
Lorsque les métadonnées sont renseignées « encapsulées » au sein du fichier METS, on utilise le sous-élément <mdWrap>.
-
[40]
Les Conditions de vente des disques enregistrés à l’Exposition coloniale sont conservées au Musée Guimet. Ce document précise également les modalités de distribution des disques. Notamment, une collection de disques est remise au Musée d’ethnographie du Trocadéro ainsi qu’au Musée permanent des Colonies (ces collections ont été versées au Musée de l’Homme puis au Centre de recherche en ethnomusicologie). De même, certains interprètes ainsi que des fonctionnaires de l’administration coloniale, des membres du personnel du Musée de la Parole, Mady Humbert-Lavergne et Philippe Stern reçoivent une collection à titre de remerciement. Enfin, parallèlement aux matrices conservées par le Musée de la Parole et héritées par le BnF, plusieurs exemplaires des disques sont conservés par le Département de l’audiovisuel.
-
[41]
Il arrive lors de la numérisation de fonds inédits que disques compacts et fichiers numériques ne correspondent pas point par point à l’ordre des supports d’enregistrement originaux.
-
[42]
Collectionneur passionné, Deben Bhattacharya (1921-2001) a parcouru l’Europe, l’Asie et l’Afrique afin de collecter les musiques de la vie quotidienne. De mariages en concerts, il a rassemblé sept cents heures de musique fixées sur bandes magnétiques. À côté des sources sonores, un important corpus documentaire enrichit le fonds conservé au Département de l’audiovisuel de la BnF : catalogue personnel décrivant et illustrant les enregistrements, annotations musicales, courriers, documents administratifs, contrats, etc.
-
[43]
Charles Delaunay (1911-1988), fils des peintres Sonia et Robert Delaunay, commence très tôt une collection de disques qu’il complète tout au long de sa vie. À la fois organisateur de concerts, producteur, imprésario et éditeur, il fonde avec Hugues Panassié la revue Jazz Hot en 1935, puis crée le label Swing, première compagnie musicale consacrée au jazz. Il lance le label Vogue avec Léon Cabat et dirige Jazz Hot jusqu’en 1980. En 1979, il fait don à la BnF de sa considérable collection de disques et de ses archives ; un corpus d’environ 22 000 disques, 11 000 78 tours et 11 000 33 tours ainsi que de nombreuses cassettes analogiques, films et bandes magnétiques ou encore des copies d’émissions radiophoniques.
-
[44]
La chanson Boulayoune thiberkanine – L’homme aux yeux noirs – fut éditée en 1949.
-
[45]
On qualifie d’item l’élément minimal d’un ensemble ordonné.
-
[46]
On distingue habituellement les données primaires des données secondaires. Par données primaires, on désigne le corpus collecté : corpus sonore, vidéo, textuel ou iconographique et les signaux associés à la parole et à la musique alors que les données secondaires sont créées a posteriori. Le Centre de Ressources pour la Description de l’Oral (CRDO), devenu l’entité COllection de Corpus Oraux Numériques (COCOON), fait à cet égard une distinction entre les données (corpus sonores ou vidéos et tous signaux associés à la parole) et les ressources (enrichissement de corpus, lexiques, bases de référence, systèmes de représentation, grammaires, etc.). Voir Baude Olivier, dir. Corpus oraux. Guide des bonnes pratiques. Paris, CNRS Éditions, 2006.
-
[47]
Nous faisons référence au programme d’archivage pérenne des données collectées par les linguistes du Laboratoire de Langues et Civilisations à Tradition Orale (LACITO), UMR 7107 du CNRS. Ce programme vise l’archivage et la diffusion des documents assemblés par les chercheurs. L’association des matériaux sonores collectés et des textes produits par les scientifiques (traductions, transcriptions, représentations orthographiques, gloses morphologiques, etc.) est centrale. À cet effet le LACITO propose un agencement des documents sonores et textuels en XML selon une DTD ordonnée spécifiquement pour les fonds linguistiques. Celle-ci définit une structure des documents comportant un à quatre niveaux hiérarchiques : le texte, la phrase, le mot ou le morphème. Chaque niveau compte des données d’analyse (transcriptions et traductions) et un élément <AUDIO> qui indique la plage des données sonores correspondant aux ressources textuelles.
1La croissance des collections numériques fait surgir de nouvelles interrogations. La masse des flux électroniques à organiser, conserver, partager et diffuser révèle des enjeux fondamentaux tant aux plans culturel et juridique que technique et organisationnel. La dématérialisation de l’information transforme les savoirs professionnels et ouvre de nouveaux champs de recherche. Au cœur de ces réflexions, les bibliothèques numériques sont, plus que jamais, confrontées aux impératifs de collecte, d’enrichissement, de diffusion et de pérennisation des corpus. Numérisation des collections, interopérabilité [1] des systèmes et conservation du patrimoine numérique constituent des défis manifestes pour les professionnels. La maîtrise des technologies et des systèmes d’information devient essentielle. Dans ce cadre, les métadonnées [2] Metadata Encoding and Transmission Standard (METS) participent, via la construction d’ensembles numériques interopérables, à la mise en commun et à la transmission d’un patrimoine pérenne et cohérent.
2Afin d’assurer l’accès du plus grand nombre à la mémoire sonore, écrite et iconographique, les programmes des grandes institutions patrimoniales et de leurs tutelles s’orientent vers la numérisation et l’organisation des corpus dans des formats ouverts et interopérables, et selon des normes et des protocoles internationaux. Qu’il s’agisse d’images fixes ou animées, textes publiés ou notes manuscrites, corpus sonores inédits et édités – comme les fonds de chansons kabyles de l’immigration – la diffusion et la conservation des collections (indépendamment du support, du contenu et du format des données) requièrent en effet le respect de politiques raisonnées de gestion de l’information. Ces dernières sont établies selon les préconisations émises par des organismes pluridisciplinaires comme l’International Federation of Library Associations and Institutions (IFLA) ou par des associations spécialisées telles que, dans le domaine du son et de l’audiovisuel, l’Association Française des détenteurs de documents Sonores et Audiovisuels (AFAS), l’International Association of Sound and Audiovisual Archive (IASA) [3] et l’Association Internationale des Bibliothèques, archives et centres de documentation Musicaux (AIBM) [4].
3Dans le même esprit, la normalisation [5] des collections est définie par des comités professionnels, prescripteurs de bonnes pratiques à l’échelle nationale et internationale, comme l’Association Française de Normalisation (AFNOR), le Comité Européen de Normalisation (CEN) ou encore l’Organisation internationale de normalisation (ISO).
L’Open Archival Information System : un modèle d’organisation des données numériques
4Le modèle de référence Open Archival Information System (OAIS) est devenu en 2003 la norme ISO 14721. Il permet une organisation des fonds d’archives et ce, dès leur entrée dans l’archive numérique ayant vocation à les conserver, jusqu’à leur diffusion, par le biais par exemple, de catalogues de bibliothèques. Ce modèle conçu en 1995 pour archiver des informations techniques et scientifiques, à la demande de l’ISO et à l’initiative du Consultative Commitee for Space Data Systems (CCSDS) [6], s’est depuis ouvert à d’autres métiers et notamment aux professions des archives et des bibliothèques. Il propose une organisation conceptuelle de l’archivage des objets physiques et numériques et vise la pérennisation des ressources électroniques. La fonction principale de l’OAIS est l’établissement de règles communes à l’ensemble des organisations chargées de la production, de la diffusion ou de la sauvegarde de données électroniques. Ses préconisations concourent à aider les décideurs à prendre des orientations en matière d’implémentation de systèmes d’information compatibles avec une politique d’archivage à très long terme.
5L’OAIS conceptuel et ne définit pas une mise en œuvre spécifique des systèmes. C’est pourquoi des archives électroniques mutualisées, dédiées aux besoins des institutions et de leurs collections sont créées par les organismes de recherche, les grandes bibliothèques et les Archives nationales. Plusieurs programmes d’archives pérennes, établis selon la norme OAIS, et consistant en la conservation de documents numériques d’intérêt national ou international, sont ainsi conçus.
6À l’échelle européenne, le programme wePreserve [7] associe le consortium européen Preservation and Long-term Access through Net worked Services (Planets) – développement d’outils et de services pour conserver et accéder à long terme au patrimoine numérique –, le projet Cultural, Artistic and Scientific knowledge for Preservation, Access and Retrieval (CASPAR) – accès et conservation des ressources culturelles, artistiques et scientifiques –, et les actions menées par le réseau Digital Preservation Europe (DPE) – recherche, outils et méthodes pour la préservation numérique.
7En France, la Bibliothèque nationale de France [8] a lancé en 2009 le Système de Préservation et d’Archivage Réparti [9] (SPAR). Son fondement est la conservation de documents numériques dans une double optique, de sécurité et de pérennité de l’information.
8Dans le domaine de l’enseignement supérieur et de la recherche, la Plate-forme d’archivage du Cines (PAC) portée par le Centre Informatique National de l’Enseignement Supérieur (CINES) a pour objectif de doter la communauté scientifique française d’un service de préservation à long terme des données numériques. PAC conserve aujourd’hui les thèses déposées sous forme électronique dans l’application Signalement des Thèses électroniques, Archivage et Recherche (STAR) développée par l’Agence Bibliographique de l’Enseignement Supérieur (ABES). La plate-forme d’archivage du CINES préserve également les revues en sciences humaines et sociales numérisées dans le cadre du programme Persée ou les articles scientifiques versés dans l’archive ouverte pluridisciplinaire Hyper Article en Ligne (HAL).
9Mené par le Très Grand Équipement Adonis (TGE-Adonis), un programme pilote d’archivage pérenne des corpus sonores est assuré conjointement par le Centre d’Étude et de Recherche sur la Documentation Orale (CERDO) – chargé des fonctions d’entrée et de l’accès aux données –, le CINES et l’Institut national de physique nucléaire et de physique des particules (IN2P3). Les données conservées dans PAC sont diffusées par le CERDO via des portails spécifiques : le portail du Laboratoire de Langues et Civilisations à Tradition Orale (LACITO), le Corpus de la parole qui donne accès aux langues de France [10] et le portail Documentation and Archiving of Tibetan and Himalayan Languages and Linguistics (DALLITH).
10D’autres projets sont en cours comme la conservation des vidéos universitaires réalisées par Canal-U ou l’archivage de données sur les risques naturels collectées par l’Institut National de Recherche en Sciences et Technologies pour l’Environnement et l’Agriculture (IRSTEA) versés dans la plate-forme d’archives ouvertes Hyper Article en Ligne (HAL).
11Autre initiative, les Archives de France ont mis en production une plate-forme PILote d’Archivage Électronique (PILAE). Dans le cadre du développement de l’administration électronique, Pil@e est conçu pour recevoir, traiter, conserver et communiquer les archives numériques des services centraux de l’État. Il a vocation à intégrer le Système d’Information Archivistique (SIA) du Centre des Archives nationales situé à Pierrefitte-sur-Seine.
Les six grandes sections du modèle OAIS
12Les six grandes sections du modèle [11], présentées ci-dessous, donnent une trame générique à respecter afin d’assurer la préservation des ressources numériques au sein des organisations vouées à l’archivage à long terme.
13Ce modèle délimite clairement l’archive au sens de l’OAIS – organisme consacré par exemple à la conservation des fonds musicaux – par rapport à son environnement extérieur. Il présente les étapes relatives à l’archivage et à la diffusion des paquets d’informations [12], de la réception des corpus à leur communication, en passant notamment par la gestion et le stockage des fonds.
14En parallèle au modèle fonctionnel, le modèle d’information détaille les informations nécessaires à la conservation du « paquet d’informations archivé » (graphique ci-dessous).
Vue détaillée d’un paquet d’informations archivé [13]
Vue détaillée d’un paquet d’informations archivé [13]
15On entend par « paquet d’informations archivé » – Archival Information Package (AIP), un paquet d’informations composé d’un contenu d’information (objet principal de la pérennisation) et de son information de pérennisation – Preservation Description Information (PDI). Le concept d’information est fondamental pour le modèle OAIS. Il décrit l’association des données et de leur information de représentation qui traduit un Objet-données [14], physique ou numérique, en concepts plus explicites.
16Quatre classes d’Objets-information (Objet-données interprété par son information de représentation) sont nécessaires pour la conservation à long terme d’un paquet d’informations archivé. Il s’agit du contenu d’information, de l’information de pérennisation, de l’information d’empaquetage [15] et de l’information de description (permet aux utilisateurs de rechercher et d’accéder aux données).
17Prenons l’exemple des œuvres de Taos Amrouche. Une notice de catalogue de bibliothèque indique par exemple le nom de l’interprète, le type de document : (« enregistrement sonore »), le titre (« Les chants de Taos Amrouche : chants berbères de Kabylie ») ou encore la description matérielle de l’enregistrement (« 5 disques compacts + 1 brochure ») et l’éditeur (« L’Empreinte Digitale »). Des informations associées signalent des transcriptions et la correspondance de l’artiste. Les paramètres techniques des supports numériques (disques compacts) transférés dans l’archive sont également mentionnés (encodage, définition, format des fichiers).
18Plusieurs catégories d’informations (métadonnées) sont donc nécessaires pour pérenniser, comprendre et rendre accessible un paquet d’informations. Parmi elles, l’information de pérennisation permet une préservation à très long terme du contenu d’information – un chant par exemple – dans un cadre intelligible, organisé et sécurisé. Elle recense quatre sous-ensembles : l’information de provenance – relative à l’origine et à l’historique de l’information –, l’information de contexte – s’intéresse aux liens entre l’information et son environnement –, l’information d’identification – reconnaît les objets numériques à l’aide d’identifiants pérennes [16] : syntaxe URI, identifiants OAI, système Archival Resource Key (ARK) –, et enfin l’information d’intégrité qui décrit les mécanismes d’authentification garantissant le contenu.
19L’information de contexte, information de pérennisation de l’OAIS, appliquée à l’aide d’un format de métadonnées, le format METS, concourt ainsi à la conservation et à la compréhension du patrimoine sonore.
Les métadonnées METS : une implémentation de l’OAIS pour la conservation et l’échange des objets numériques
20Le format de métadonnées METS est issu du projet Making of America II (MOA-2) [17]. Il a été élaboré à l’initiative de la Digital Library Federation en 2001 (version 1.1 en 2002) par un groupe de travail pour le développement d’un standard d’objet appliqué aux bibliothèques numériques. Maintenu par la Library of Congress, METS est un schéma eXtensible Markup Language (XML) [18] défini pour permettre la conservation et l’échange de documents numériques répondant au modèle OAIS. Ce schéma non propriétaire et extensible se décline autour de sept sections arborescentes et de trois classes de métadonnées. Lors de sa création, et c’est l’atout de ce format, le document METS contient la description de la structure hiérarchique des objets électroniques qui forment la ressource. Il répertorie les noms ainsi que la localisation des fichiers et assemble les métadonnées administratives, structurelles ou descriptives associées aux documents. Le document METS peut alors être conservé et diffusé au sein d’une archive OAIS. Il comprend d’un côté la ressource numérique et de l’autre, les métadonnées associées.
Sections arborescentes, métadonnées, cartes de structure et hyperliens pour décrire, organiser et diffuser le patrimoine sonore
21De manière générale, les sept sections METS [19] permettent la description et l’ordonnance des collections numériques. L’avantage de ce format est donc d’admettre l’archivage des objets hétérogènes simples, comme une photographie ou une page, ou la conservation des objets complexes [20], à l’instar d’un livre composé de chapitres. Seules la carte de structure, structural Map, et la liste des fichiers numériques, file Section, sont obligatoires. Issu de cette dernière section, l’élément « fileSec » situe et décrit les fichiers alors que la balise « fileGroup » les regroupe. En cinquième section, la carte de structure comprend la description du plan du document, de l’organisation des pages d’un ouvrage ou des images d’un lot. Elle peut être physique ou logique. Essentielle pour la compréhension du fonds, la carte de structure retrace le cheminement du collecteur. Associée à la section structural Link qui indique les liens entre les éléments de la carte, celle-ci assemble les différents composants logiques ou physiques du paquet d’informations archivé.
22À la carte de structure et aux hyperliens METS s’ajoutent trois classes de métadonnées qui décrivent et organisent les objets numériques. Descriptives, administratives ou structurelles, ces trois catégories de données sont regroupées au sein d’un objet complexe METS et participent à l’organisation du fonds d’archives sonores telle que créée par le collecteur.
23Prenons l’exemple de la numérisation d’un disque 45 tours de la chanteuse Hanifa. La préservation et l’échange de ce document, associé à la photographie de l’artiste, impliquent à la fois la rédaction d’informations descriptives – les notices de catalogage –, la conservation des aspects techniques – les différents formats de fichiers –, et l’enregistrement de données administratives – droits d’auteur et cycle de vie du document. De même, sont nécessaires, la considération de la structure physique de l’objet (organisation des fichiers) et la connaissance de sa structure logique (agencement intellectuel des différentes parties).
24Pour mener à bien la numérisation, les métadonnées de structure, fondamentales pour comprendre un corpus, permettent de connaître tous les fichiers (inventaire, emplacement, taille des fichiers) qui composent un document quels que soient leur format, leur nature. Elles retracent la relation physique (linéaire) entre ces documents, leur ordre d’affichage et indiquent le chemin vers les fichiers cibles. Mais elles décrivent également les relations logiques tissées entre les fichiers : délimitation des chapitres, index ou détail du contenu d’un objet (vue de détail de la pochette d’un disque 45 tours, par exemple [21]).
25Les aspects relatifs au cycle de vie et à la consultation des collections sonores sont organisés par les métadonnées administratives. Elles couvrent les métadonnées techniques, les métadonnées de gestion des droits et les métadonnées de source et de provenance. Les métadonnées techniques (format et identification du paquet) assurent la conservation et la restitution des fichiers. Les métadonnées de gestion des droits contrôlent l’accès et l’usage du document. Enfin, les métadonnées de source et de provenance garantissent le lien avec le document source (cote et support du document physique) et maintiennent l’historique des modifications du paquet d’informations (numérisation, versement, migration, etc.).
26Plus communes, les métadonnées descriptives permettent de saisir le contenu d’un objet à l’aide d’une description bibliographique (titre, auteur, éditeur, etc.). Elles participent à l’identification des paquets par un identifiant pérenne et une description minimale, au format Dublin Core [22] par exemple. Une description bibliographique dans un format normalisé permet l’interopérabilité des différents entrepôts de données et concourt ainsi, via un protocole d’échange de l’information, à la circulation et à la mutualisation des métadonnées. À cet égard, le protocole de moissonnage OAI-PMH [23] est mis en application par les catalogues collectifs d’archives sonores et audiovisuelles, Telemeta [24] et le Portail du patrimoine oral [25].
27La carte de structure, section <structMap> du document METS, essentielle à la conservation du contenu d’information, gère les niveaux de granularité du paquet d’informations. Comme le soulignent les recommandations du CCSDS, cette information contextuelle décrit « les liens entre un contenu d’information et son environnement ». Précieuse pour la compréhension des fonds d’archives inédits, elle permet de retracer les relations entre un contenu d’information – tel un dialogue enregistré par le linguiste Ferdinand Brunot – et un autre Objet-information – une fiche d’enregistrement – outil de description contemporain du corpus des Archives de la Parole [26].
28Associé à la carte de structure, un système élaboré de pointeurs [27], le XML Pointer Language, renseigné par les liens de structure METS – section <structLink> – permet d’assembler les différents fichiers. Il relie les métadonnées avec les fichiers qu’elles décrivent. C’est la carte de structure qui reconstitue la navigation, linéaire ou logique, dans le document. Ainsi, pour un fonds d’archives consacré à l’œuvre de Slimane Azem, les notes prises par le musicien lors de la composition des mélodies et sa documentation personnelle (coupures de presse ou écrits critiques à propos, par exemple, du contexte politique algérien) seront liées, au sein de la carte de structure, aux fichiers sonores par le biais des hyperliens METS.
29Unies à la carte de structure et aux hyperliens, les trois catégories de métadonnées METS – regroupées au sein d’un seul document, l’objet complexe ou, en d’autres termes, le fonds d’archives sonores – permettent d’envisager la construction de cartes numériques en s’appuyant sur le cheminement intellectuel des collecteurs ou des artistes. Il devient alors possible d’organiser, d’échanger et de préserver à long terme, des collections sonores jusque-là inédites.
Cartes de structure, niveaux d’information et métadonnées : un ordonnancement commun pour les fonds d’archives sonores candidats à une préservation à long terme
30Afin de conserver l’arborescence du langage XML, une organisation hiérarchique des fonds d’archives sonores est essentielle. Celle-ci définit les niveaux de granularité de l’information numérique, en partant de l’ensemble (la collection, le fonds d’archives ou encore un axe de recherche, une campagne de collecte) au fichier (sonore, image, vidéo ou texte). Cet agencement par niveaux permet un versement des fonds structurés selon le format METS.
31À chaque niveau d’information [28], ensemble, groupe (dossier par musicien ou témoin, dossier par événement : concert ou session d’enregistrement), objet (item numérique, page, photographie, plage de disque compact) ou fichier – correspond des métadonnées de préservation spécifiques ou génériques. Ces dernières permettent d’organiser le cycle de vie des documents, les droits d’auteur, les migrations, l’ordonnancement logique des paquets d’informations ou encore les autorisations de consultation. L’accès aux sources d’information et les différentes métadonnées, descriptives, administratives ou structurelles sont également indiqués.
32Toutefois, l’établissement de niveaux de granularité communs aux fonds d’archives sonores candidats au versement dans une archive OAIS, étape essentielle de la mise aux normes numériques des corpus, ne peut être abordé sans l’élaboration pour chaque fonds observé, de cartes de structure physiques et logiques des archives. Celles-ci mettent en lumière la finesse des liens et l’organisation du corpus mais participent également à l’agencement hiérarchique des documents, point de départ de toute syntaxe arborescente selon le langage XML et les métadonnées METS.
Modèle d’information et cartes de structure, essai pour la gestion de la granularité du fonds de l’Exposition coloniale
33Dans l’esprit de l’arborescence XML, un modèle d’information permet de définir la gestion de la granularité. Les diverses configurations de paquets sont ainsi envisagées. Nous proposons ci-après, en premier lieu, un aperçu de l’organisation physique du fonds [29] (carte de structure physique établie d’après les supports analogiques) pour présenter, en second lieu, une possible organisation intellectuelle des collections (environnement numérique).
34Les collections de l’Exposition coloniale internationale de 1931 sont aujourd’hui conservées pour des raisons historiques [30] par trois institutions (Bibliothèque nationale de France, Centre de Recherche en Ethnomusicologie (CREM) [31] et Musée national des Arts asiatiques Guimet). Les modèles proposés tiennent compte de cette spécificité.
Carte physique du fonds d’archives
35L’organisation physique du fonds – agencement matériel des archives – se présente selon cinq niveaux arborescents (tableau ci-dessous). Le niveau de la collection « set » est récursif.
Carte physique du fonds de l’Exposition coloniale
| Set 3 (Collection 3) | Boîte |
| Set 2 | Chemise |
| Set 1 | Sous-chemise |
| Groupe | Disque, fascicule relié, catalogue, correspondance (enveloppe et lettre), classeur de photographies |
| Objet | Face de disque, page, photographie |
| Fichier | Fichier numérique, flux de bits |
Carte physique du fonds de l’Exposition coloniale
36En « set » 3 (collection de niveau 3) nous notons les boîtes d’archives. En « set » 2 et 1, sont indiquées les chemises (niveau 2) et sous-chemises (niveau 1). Celles-ci assemblent l’ensemble des documents papier : catalogues, fascicules, lettres et classeurs.
37À l’échelle du groupe d’objets : les disques, les fascicules reliés, les classeurs de photographies ainsi que les catalogues et la correspondance. Le niveau de l’objet compte la face de disque, la page ou la photographie à l’unité.
38Enfin, le fichier correspond à l’objet-données numérique (fichier ou flux de bits).
39Lors de la numérisation du fonds, chaque objet peut être composé de plusieurs fichiers selon les besoins : projet favorisant l’accès et la valorisation ou numérisation de conservation. Par exemple, un objet page de catalogue comptera un fichier pour l’image de la page (fichier TIFF) et un fichier pour la transcription OCR (fichier XML). Un objet face de disque sera constitué, d’un fichier BWF – transfert du support analogique pour une conservation à long terme –, et d’un fichier MP3 pour sa diffusion.
Carte de structure logique et hyperliens METS pour une organisation immatérielle des collections
40Dans la perspective d’une structuration numérique commune des archives, une enveloppe METS générique est créée. Elle associe les fonds conservés dans les différents sites, BnF, CREM (MNHN) et Musée Guimet. Ci-dessous, nous proposons la carte de structure logique (tableau des niveaux de granularité) du fonds de l’Exposition coloniale.
| Set 3 | Fonds commun de l’Exposition coloniale |
| Set 2 | Classeur de photographies Philippe Stern, photographies Paul Pivot, collections de disques 78 tours Archives administratives par domaine (valorisation et analyse du corpus, édition, documents juridiques, budget, cours et conférences, conservation des documents) |
| Set 1 | Photographies – classement géographique, pays Catalogue des disques Mady Humbert-Lavergne, correspondance, ensemble des fiches d’enregistrement, catalogue des disques Pathé, documents juridiques par institution (BnF, Musée Guimet, CREM) Conférences du musée Guimet et du Musée de la Parole |
| Groupe | Photographies par entité/sujet (photographies des ensembles instrumentaux,
des musiciens et des instruments) Disques 78 tours à l’unité Ensembles géographiques ou sections par pays du catalogue Mady Humbert-Lavergne Indications destinées à ceux qui cherchent à recueillir des chants populaires, feuillets rassemblant les « signes spéciaux » ou notations musicales [32] (timbres, accentuations, phrasés), fiches par musiciens, morceaux et ensembles Courriers divers et courriers administratifs – contrats, factures, commandes, projet de collectes dans les colonies Liste des éditions de la « Bibliothèque musicale », conditions de vente et de distribution des disques, autorisations de vente, sections du catalogue Pathé : 1) disques de Madagascar 2) disques de la côte des Somalis Arrêté ministériel (création de la section musicale du musée Guimet), contrat entre Paul Geuthner, Hubert Pernot et Philippe Stern pour la « Bibliothèque musicale » Projet de contrat entre l’Institut de phonétique et le Commissariat général de l’Exposition Méthode de classement de la section musicale, matériel de conservation Budget (enregistrements, transports, indemnités, factures) Programmes des conférences Proposition par Léon Cayla d’un modèle éditorial pour les enregistrements |
| Objet | Photographie, face de disque 78 tours, page |
| Fichier | TIFF, UIT, BWF, WAV, MP3, XML, PDF... |
41Ce tableau propose six niveaux de granularité.
42Le fonds commun de l’Exposition coloniale est indiqué au niveau « set » 3. À l’échelle « set » 2, sont renseignés : le classeur de photographies de Philippe Stern [33] qui assure la direction de la collecte des enregistrements, les photographies d’illustration prises par Paul Pivot ainsi que les fonds sonores : 173 disques 78 tours de 25 cm.
43En octobre 1931, Paul Pivot, photographe, réalise 157 photographies des musiciens et chanteurs qui se produisent dans le cadre de l’Exposition. Ce travail de commande est aujourd’hui diffusé sur Gallica, la Bibliothèque numérique de la BnF. Parallèlement, Philippe Stern et Mady Humbert-Lavergne, sa proche collaboratrice, collectent 346 enregistrements fixés par la compagnie Pathé sur 173 disques double face. Plus de dix-sept heures de musiques d’Afrique, d’Asie et d’Océanie sont ainsi collectées : le répertoire issu des colonies africaines est majoritaire et s’élève à douze heures trente minutes. Ce corpus musical est également accessible sur Gallica indépendamment des photographies.
44Les archives papier sont classées en cinq grands domaines : valorisation et analyse du corpus (catalogue des disques, fiches documentaires, procédures de travail), édition (catalogue Pathé, conditions de vente des disques), documents juridiques (contrat relatif à la « Bibliothèque musicale », arrêté ministériel portant création de la section musicale du musée Guimet), budget (transport des interprètes, indemnités) cours et conférences [34] et enfin conservation (organisation et conservation des archives de la section musicale du Musée Guimet).
45Les photographies sont ordonnées par ensembles géographiques « [...] Afrique noire, Afrique du Nord [...] » ou pays, puis par entité (photographies des ensembles [35], des musiciens et des instruments). Les ensembles géographiques sont indiqués en collection de niveau 1 alors que les entités sont placées à hauteur du groupe. En collection 1 sont disposés également le catalogue des disques élaboré par la musicologue Mady Humbert-Lavergne, le catalogue des disques Pathé, ainsi que les documents juridiques et les conférences du Musée Guimet et du Musée de la Parole, la correspondance et l’ensemble des fiches d’enregistrement. Afin d’organiser la collecte et faciliter l’analyse ultérieure, Philippe Stern et ses collaborateurs forment en regard des enregistrements sonores un important corpus documentaire constitué de fiches d’enregistrement et de documents administratifs. Comme pour le fonds des Archives de la parole, les fiches sont élaborées à l’aide des questionnaires rédigés et perfectionnés par les musicologues du Musée de la Parole. En outre, musiciens et instruments sont photographiés et les renseignements iconographiques et documentaires ainsi recueuillis permettent de réaliser des fiches par morceau, par musicien et par ensemble avec instruments.
46À hauteur du groupe, on note, les photographies par entité, les disques 78 tours à l’unité ainsi que les ensembles géographiques ou sections par pays du catalogue rédigé par Mady Humbert-Lavergne. Les Indications destinées à ceux qui cherchent à recueillir des chants populaires et les feuillets rassemblant les « signes spéciaux » ou notations musicales (timbres, accentuations et phrasés) à l’intention des collaborateurs de la collection « Bibliothèque musicale du musée de la Parole et du musée Guimet » [36], ainsi que les fiches par musiciens, morceaux et ensembles sont à l’échelle du groupe. Sont également situés à cette même hauteur les contrats, factures et commandes et des courriers divers ou abordant spécifiquement un projet, non abouti, de collectes dans les colonies lancé par Hubert Pernot.
47Toujours au niveau du groupe sont situés, la liste des éditions de la « Bibliothèque musicale », les conditions de vente et de distribution des disques, les autorisations de vente, les deux sections du catalogue Pathé (disques de Madagascar et disques de la côte des Somalis [37]), l’arrêté ministériel de création de la section musicale du Musée Guimet ainsi que le contrat entre le libraire orientaliste Paul Geuthner d’une part, Hubert Pernot et Philippe Stern d’autre part. Au même niveau sont également disposés des documents à propos de l’organisation du fonds, du matériel de conservation et du budget (matériel d’enregistrement, transport des troupes [38], indemnités versées aux interprètes, factures diverses) ainsi qu’un projet de contrat rédigé en mai 1930 entre l’Institut de phonétique et le Commissariat général de l’Exposition dirigé par le maréchal Lyautey, et les programmes des conférences. De même, une proposition de modèle éditorial pour la diffusion des enregistrements émise par le gouverneur des Colonies Léon Cayla, secrétaire général de l’Exposition coloniale, est agencée au même niveau (groupe).
48Les photographies, les faces des disques 78 tours et les pages des documents sont situées à l’échelle de l’objet, leurs versions numériques à hauteur du fichier.
49Si les niveaux de granularité présentés ci-dessus retracent l’ordonnancement du fonds au sein de la carte de structure logique <structMap> du fichier METS, les liens de structure indiqués dans la section <structLink> tissent les associations logiques entre les documents pluri-médias.
Parcours au cœur de la collection numérique : les liens de structure METS
50Afin d’associer les documents hétérogènes (son, texte, image) du corpus, nous proposons ci-dessous un parcours élaboré à l’aide de la gamme des pointeurs METS. Selon la politique documentaire des institutions, la numérisation peut être conçue dans une optique de conservation, de description et/ou de valorisation (présentations thématiques, collections virtuelles). Ces diverses options ont un impact sur la carte des liens de structure. Les scénarios introduits ci-après s’inscrivent dans le cadre d’une numérisation de conservation des archives de l’Exposition coloniale.
- Scénario 1 – Numérisation selon le formalisme METS du seul fonds conservé à la BnF : le sous-élément <mdRef> permet alors d’associer le document METS BnF aux métadonnées administratives et descriptives des fonds numérisés du Musée Guimet et du Centre de recherche en ethnomusicologie.
- Scénario 2 – Numérisation commune des corpus conservés par les différentes institutions : une enveloppe METS générique est alors créée.
- Scénario 3 – Numérisation commune des corpus mais création d’une enveloppe METS spécifique pour chaque institution : les différentes enveloppes sont liées par un metspointer.
52Selon le premier scénario, le sous-élément <mdRef> [39] lie les fonds iconographiques, sonores et administratifs des trois organismes. Il permet d’associer le document METS BnF aux métadonnées administratives et descriptives des archives numérisées du Musée Guimet et du CREM. Voici à titre d’exemple, quelques possibilités d’association des fonds dans ce cadre.
53Les conférences musicales du Musée Guimet et du Musée de la Parole sont assemblées aux enseignements donnés par les experts du Musée d’ethnographie du Trocadéro. De même, les enregistrements conservés à la Bibliothèque nationale de France sont à rapprocher des éditions de la « Bibliothèque musicale », des Indications rédigées par Philippe Stern et des « signes spéciaux » employés par les musicologues (Guimet). Les métadonnées du catalogue Pathé (conservé dans les magasins de Gaumont Pathé Archives) Quelques disques à aiguille de Madagascar et de la Côte des Somalis sont également liées par le sous-élément <mdRef> aux fonds sonores de la BnF.
54Toutefois, une enveloppe METS commune des archives conservées par les trois institutions (scénario 2) permet d’associer aisément les objets au sein du paquet d’informations. Niveaux de granularité et liens de structure contribuent ainsi à l’organisation intellectuelle du corpus. Quelques exemples sont exposés ci-dessous.
55Le catalogue de photographies de Philippe Stern (Guimet) d’un côté, et le fonds de photographies Paul Pivot – disponible sur Gallica – de l’autre, constituent la division (carte de structure logique) « Photographies – classement géographique, pays » en « set » 1. Celle-ci est liée par le pointeur par aux fichiers . WAV des disques (BnF). Ce pointeur accomplit la lecture en parallèle des photographies et du lot de fichiers sonores. Un lien seq associe l’objet numérique « photographie » du fichier METS vers le lot des fichiers TIFF. Il permet le défilement séquentiel des fichiers images. De plus, un filepointer indique une association simple entre l’objet photographie et le fichier son. Photographies et disques peuvent donc être mis en relation selon diverses modalités : lecture en parallèle, défilement séquentiel ou lien simple à l’unité.
56Chaque face de disque est liée au fichier TIFF du catalogue élaboré par Mady Humbert-Lavergne (Guimet). Aussi, les liens proposés sont-ils des filepointer lorsqu’il s’agit de pointer l’ensemble de la page numérisée ou des pointeurs area pour lier une face de disque à sa notice analytique dans le catalogue. De plus, la division « conservation » des archives de la section musicale du musée Guimet en « set 2 » est jointe par un filepointer aux Indications destinées à ceux qui cherchent à recueillir des chants populaires (Guimet).
57Un filepointer assemble les conditions de vente des disques [40] aux fichiers sonores conservés et numérisés à la BnF.
58Chaque fiche d’enregistrement est associée au fichier sonore qu’elle analyse par morceau, musicien ou ensemble. De même, lorsque les plages des disques compacts ne correspondent pas exactement aux faces des disques 78 tours [41], le pointeur seq, qui décrit l’ordre de défilement séquentiel des fichiers, permet un accès aux enregistrements initiaux dans le respect de l’ordre des matrices.
59Autre lien, un filepointer met en relation les factures et commandes (BnF) avec la correspondance de Philippe Stern (BnF) demandant accord aux différents commissaires des colonies pour l’édition et la mise en vente des disques par la firme Pathé. Deux autres pointeurs assemblent les fichiers sonores (BnF), les documents relatifs aux modalités financières des captations sonores, et la correspondance coloniale (BnF). Ces courriers sont, par exemple, associés aux enregistrements d’Afrique du Nord et de Madagascar. Plus précisément, le courrier du 19 octobre 1931 du commissaire de Madagascar à Philippe Stern ainsi que l’autorisation manuscrite du chef malgache Razafimahefa donnant « autorisation à la vente moyennant la somme forfaitaire une fois versée de 100Frs [...], par deux morceaux (un disque) », sont liés par un filepointer. Un pointeur area sélectionne un morceau ou une face de disque enregistrés par la troupe Mpilalao.
60Enfin, un filepointer met en exergue le contexte économique et commercial de l’Exposition et notamment les disparités d’accès aux droits d’exploitation des enregistrements. Il associe les enregistrements sonores (BnF) ou le catalogue de Mady Humbert-Lavergne (Guimet) aux conditions de vente des disques ainsi qu’au courrier de Philippe Stern destiné au lieutenant-colonel Delayen (BnF). Dans ce document, Philippe Stern propose, pour tout remerciement, d’« envoyer [...] un appareil phonographique avec la collection des disques de la région » aux interprètes stationnés dans les camps militaires de Toulon et Fréjus.
61La section ci-dessus indique quelques associations entre des pièces conservées au Musée Guimet et des archives situées à la Bibliothèque nationale de France au sein d’un document METS commun (scénario 1). Modéliser l’ensemble du fonds en XML en développant des fichiers METS spécifiques pour chaque institution est également pertinent (scénario 3).
62Dans cette optique, un metspointer – pointeur externe au document METS – vise un fichier METS spécifique relatif au fonds du Musée Guimet. De même, deux autres metspointer lient les archives conservées au CREM aux documents METS organisant les fonds de la BnF et du Musée Guimet.
63Ainsi, alors que la carte de structure physique des fonds garde en mémoire l’organisation première des supports originaux, la carte de structure logique de l’Exposition coloniale de 1931 propose une arborescence numérique du corpus (niveaux de granularité) dégagée de l’agencement matériel des documents originaux (disque, catalogue, fascicule relié, correspondance, classeur de photographies, etc.). De plus, les liens de structure mettent en lumière les relations tissées au sein de cette information contextuelle. Un parcours électronique parmi ces archives pluri-médias est alors envisageable.
64Dans le même esprit, un modèle de structuration commun aux fonds inédits ou édités, de chansons kabyles de l’immigration candidats à une conservation pérenne, permet d’établir une arborescence numérique de l’ensemble des documents : affiches, articles, photographies, contrats, notes manuscrites, pochette de disques vinyles, cassettes audio, etc. À l’inverse d’un schéma appliqué exclusivement à des fonds édités – qui suit la structuration éditoriale des objets publiés –, il convient de se fonder sur l’observation de l’ordonnancement personnel des collecteurs et des artistes pour proposer un modèle s’appliquant à des fonds sonores inédits. Matrice de l’organisation des fonds dans l’archives OAIS, ce modèle générique arborescent peut alors être associé à des métadonnées appliquées et à des procédures spécifiques de gestion des fonds de chansons kabyles.
Illustrer la démarche des artistes et tracer l’organisation matérielle du fonds d’archives : une approche à la fois conceptuelle et pratique
65Sans nul doute, l’apport du format METS réside – notamment pour les fonds inédits – dans sa carte de structure, la diversité de ses liens et ses trois classes de métadonnées. Ainsi formulée, l’information de contexte illustre et conserve le cheminement des artistes tout en décrivant très précisément l’organisation physique des documents (ordre des mélodies, incise dans la composition, suite des feuillets de texte). Toutefois, la conservation numérique du patrimoine sonore ne fait pas abstraction d’interrogations tant de forme que de fond.
66Point cardinal du travail du chercheur comme du gestionnaire de l’information, la mise en contexte des fonds est essentielle à leur complète compréhension. Qu’elle soit effectuée au plan général (il peut s’agir alors du contexte politique et social d’une collecte ou encore d’une approche musicologique ou historique d’une œuvre) ou particulier via le tissage de liens entre les éléments d’un fonds, cette contextualisation ne peut faire l’économie des outils innovants des technologies de l’information développés par les bibliothèques numériques. Précisément, afin de respecter l’interopérabilité des catalogues et le traitement homogène des corpus sonores, l’élaboration d’un modèle d’ordonnancement commun s’impose. Il devient alors possible de verser dans de vastes ensembles numériques des fonds musicaux inédits, comme le corpus constitué par l’ethnomusicologue indien Deben Bhattacharya [42], ou des documents édités – tout ou partie –, tels les fonds de chansons kabyles de l’immigration. Mais comment structurer des ensembles sonores hétérogènes tant par leur forme que par leur fond ? Ici, pas de normes bibliographiques ou éditoriales ; l’enjeu est de découvrir la démarche du collecteur et, sans la trahir, de la traduire dans le cadre d’une arborescence numérique fidèle à l’esprit du langage XML et des métadonnées METS. Ainsi, il s’agit de comprendre en quoi le témoignage d’un chanteur kabyle, rendant compte de la vie musicale parisienne dans les années trente, est lié aux notes manuscrites de l’ethnomusicologue collectant ses propos, pour traduire alors ce lien dans l’architecture METS.
67En d’autres termes, à travers l’observation des relations logiques et sémantiques entre les fonds sonores et la diversité de la documentation qui les accompagne (catalogues personnels, notes, analyses, photographies, croquis), il convient de retrouver la démarche initiale du collecteur ou de l’artiste (interprète, compositeur, parolier). Si l’enregistrement sonore reste au centre de l’analyse, il importe de décrire l’approche et le parcours personnel des acteurs et de les restituer par le biais des hyperliens METS.
68Mais dégager une organisation commune aux divers corpus observés fait surgir différentes interrogations en termes de méthodes et d’orientations. L’orientation archivistique de cette démarche requiert de se conformer tant au principe d’homogénéité du traitement des fonds qu’au fondement déontologique du respect de ces derniers. Le traitement effectif des fonds impose de considérer les contraintes, actuelles ou à venir, de temps et de moyens humains ou matériels. En outre, afin d’œuvrer à une plus grande cohérence du travail et favoriser un traitement rapide du document sonore, textuel ou iconographique, l’établissement de procédures normalisées est fondamental. Mais comment mettre en œuvre un modèle unique d’organisation à partir de fonds dissemblables tant par leur contenu que par leur forme ? Par ailleurs, en considérant les moyens alloués et afin d’avoir une approche efficace et pertinente, quelle méthode employer pour obtenir une vision d’ensemble de fonds parfois très vastes ou difficiles d’accès ? En d’autres termes, comment représenter un fonds aussi conséquent que celui du grand amateur de jazz Charles Delaunay [43] ou étudier les nombreuses collaborations et le vaste répertoire de l’auteur-compositeur-interprète Kamel Hamadi ? De plus, selon le principe du respect des fonds constitués par les collecteurs, de quelle manière suivre l’agencement des documents établi par ces derniers et traduire, sous forme numérique, leur parcours intellectuel ? Si pour les documents édités, les collections numériques suivent l’organisation des œuvres : chapitre, paragraphe, texte et fichier texte pour les monographies ou encore, collection de disques, disque à l’unité, face de disque puis fichier audio pour les corpus musicaux, la difficulté consiste dans le cadre de fonds inédits à retrouver l’ordonnancement logique créé par le compositeur, le musicien instrumentiste ou le collecteur. En quoi ce document de 1947 émanant de la Société des auteurs est-il lié au premier disque de Cheikh El-Hasnaoui ? Quelle association existe entre ces notes manuscrites, ce contrat d’auteur tapuscrit et la chanson Boulayoune thiberkanine [44] ? Comment traduire ce lien dans l’architecture METS ? Ici, pas de normes ou de chartes éditoriales, l’enjeu, et non le moindre, est de comprendre la démarche de l’auteur et de la restituer dans le cadre d’une arborescence numérique.
69Autre écueil, le niveau de l’objet numérique paraît essentiel. Quel objet choisir comme premier niveau de structuration du fonds ? Quels contours donner à cet objet numérique ? Pour un fonds inédit, la face d’un disque est-elle un item [45] ou est-ce plutôt le morceau et donc la plage ? Dans le cadre de témoignages oraux, que faire d’un lot de photographies sur le même témoin (musicien, locuteur kabyle) ? Celui-ci doit-il être considéré comme un objet ou comme un ensemble plus important ? Enfin, quelle place accorder à l’analyse documentaire ou scientifique faite par des spécialistes a posteriori, et de quelle manière organiser cette information avec le reste du fonds ?
70Dans ce contexte, il est opportun de dresser pour chaque fonds candidat à une conservation à long terme, une carte de structure logique, une carte de structure physique et une carte des liens de structure. Après avoir élaboré des cartes de structure particulières pour chaque corpus, l’enjeu consiste à s’abstraire des agencements spécifiques afin de composer un modèle unique d’organisation des documents primaires [46] assemblés par les auteurs.
71Cette étape franchie, il convient de déceler les liens entre une image et un extrait sonore, un catalogue et une bande, une archive numérique linguistique et sa DTD [47] afin d’associer des objets numériques à l’aide des liens de structure proposés par le schéma METS. Enfin, l’observation du modèle OAIS d’une part, et des préconisations en matière d’élaboration de systèmes d’archivages électroniques d’autre part, engagent à établir des procédures d’organisation et de gestion des documents appliquées à la spécificité du patrimoine sonore kabyle de l’immigration.
Conclusion
72La préservation à long terme des documents et l’accès du plus grand nombre à un patrimoine souvent méconnu et dispersé constituent les apports fondamentaux de la mise aux normes numériques des corpus de l’immigration. Aujourd’hui, de nombreux projets de conservation et de diffusion des archives sonores voient le jour. Parmi eux, des portails ouverts et interopérables sont particulièrement innovants. Associé au protocole de diffusion OAI-PMH, le format XML METS, qui permet l’empaquetage et la sauvegarde des collections, s’inscrit dans ce mouvement.
73Notre projet participe à l’organisation de l’information de contexte qui accompagne le document numérique. Qu’il s’agisse de retracer le cheminement intellectuel des auteurs ou de replacer les fonds dans un contexte culturel plus vaste, retrouver la démarche des collecteurs, des éditeurs ou des artistes est au cœur de cette approche. La mise en œuvre de niveaux hiérarchiques de structuration des fonds, la distinction des différentes catégories de données (primaires et secondaires) ainsi que l’observation des liens qui tissent l’information concourent au fondement d’un modèle fonctionnel appliqué à l’archivage numérique des corpus sonores de l’immigration.
- Ageron, Charles-Robert. L’Exposition coloniale de 1931 : mythe républicain ou mythe impérial ?. In Pierre Nora, dir. Les lieux de mémoire, tome I. La République. Paris, Gallimard, 1984, pp. 561-591. ISBN 2-07-070192-1
- Baude, Olivier, dir. Corpus oraux. Guide des bonnes pratiques. Paris, CNRS Éditions, 2006. 203 p. ISBN 2-271-06425-2
- Beaubien, Richard, et al., Preston Cecilia, ed. <METS> Metadata encoding and transmission standard. Primer and reference manual. Washington, DC, Digital Library Federation, c2007. 128 p. ISBN 9781933645353
- Bermès, Emmanuelle, Dussert Carbone, Isabelle, Ledoux, Thomas, et al. La préservation numérique à la Bibliothèque nationale de France : présentation technique et organisationnelle. In IFLA. Bibliothèques sans frontières : naviguer vers une compréhension globale, 10-14 août 2008, Québec. [en ligne]. IFLA, 2008. Disponible sur : http://archive.ifla.org/IV/ifla74/papers/084-Bermes_Carbone_Ledoux_Lupovici-trans-fr.pdf (consulté le 12 juillet 2012).
- Bibliothèque nationale de France, Collard Claude, dir. Des sources pour l’histoire de l’immigration en France de 1830 à nos jours. Paris, Bibliothèque nationale de France, 2006, 427 p. ISBN 2-7177-2360-9
- Calderan, Lisette, Hidoine, Bernard, Millet, Jacques, éd. Métadonnées. Mutations et perspectives. Séminaire INRIA, 29 septembre – 3 octobre 2008, Dijon. Paris, ADBS, 2008, 282 p. ISBN 978-2-84365-104-5
- Centre national de la recherche scientifique. L’archive ouverte : rôle d’une archive ouverte. In Centre de ressources pour la description de l’oral, 2012. [En ligne]. Disponible sur : http://crdo.risc.cnrs.fr/exist/crdo/ (consulté le 25 janvier 2012).
- Consultative commitee for space data systems CESDS. Modèle de référence pour un Système ouvert d’archivage d’information (OAIS). [En ligne]. Washington, D.C., CCSDS Secretariat, mars 2005. CCSDS 650.0B-1 (F). Fichier PDF. Disponible sur : International association of sound and audiovisual archives IASA. Ethical Principles for Sound and Audiovisual Archives. IASA Special Publication, 2010, no 6.
- Cordereix, Pascal. Les enregistrements du musée de la Parole et du Geste à l’Exposition coloniale. Entre science, propagande et commerce. Vingtième siècle, 2006/4, no 92, pp. 47-59.
- Hiraux, Françoise, éd. Les archives audiovisuelles. Politiques et pratiques dans la société de l’information. Louvain-la-Neuve, Academia-Bruylant, 2009, 251 p. 978-2-87209-941-2
- International association of sound and audiovisual archives. Technical Committee, [editor, Kevin Bradley]. Guidelines on the Production and Preservation of Digital Audio Objects. 2nd ed. IASA, © 2009. IASA-TC 04. ISBN 978-91-976192-2-6
- International association of sound and audiovisual archives IASA. Ethical Principles for Sound and Audiovisual Archives. IASA Special Publication, 2010, no 6.http://pin.association-aristote.fr/lib/exe/fetch.php/public/documents/norme_oais_version_francaise.pdf (consulté le 15 septembre 2012).
- Mahfoufi, Méhenna. La chanson kabyle en immigration : une rétrospective. Hommes et Migrations, septembre 1994, no 1179, pp. 32-39.
- Miliani, Hadj. Présence des musiques arabes en France. Immigrations, diasporas et musiques du monde. Migrance, 2008, no 32, pp. 91-99.
- Mokhtari, Rachid. La chanson de l’exil. Les voix natales (1939-1969). Alger, Casbah Éditions, 2001. 157 p. ISBN 9961-64-285-6
- Origines contrôlées. La revue (2007-) [Tactikollectif]. No 3. 2005-. Toulouse, Tactikollectif, 44 p.
- The library of congress. METS Implementation Registry. In METS. Metadata Encoding and Transmission Standard. Official Web Site [en ligne]. Disponible sur : http://www.loc.gov/standards/mets/mets-registry.html (consulté le 10 janvier 2009).