Notes
1 Le ministère de la Culture et de la Communication (MCC) s’intéresse aux métadonnées depuis le début de l’informatique documentaire, c’est-à-dire depuis les années 1970. Cet intérêt s’explique d’abord par la tutelle qu’il assure sur trois grands types d’institutions que sont les bibliothèques, les archives et les musées, institutions pour lesquelles la gestion des métadonnées documentaires revêt un enjeu métier essentiel. De plus, le MCC a pour mission fondamentale non seulement de soutenir la conservation et la protection du patrimoine culturel mais aussi de le démocratiser. Pour cela, il doit mettre en œuvre toutes les techniques qui facilitent l’accès physique mais aussi intellectuel aux ressources culturelles, en particulier à travers le Web. Enfin, il doit favoriser l’application des technologies numériques à la langue française ainsi qu’aux langues régionales ou minoritaires parlées par des citoyens français.
2 Pour toutes ces raisons, le MCC a développé au fil des décennies une expertise dans le domaine de la structuration et de l’interopérabilité des métadonnées. Il s’implique donc aujourd’hui dans la transition du web de données et du web sémantique, technologies sorties, ces dernières années, de leur phase expérimentale pour entrer de plain-pied dans le champ des applications.
Vers la co-production de connaissances
3 Cette évolution fait émerger de nouveaux enjeux stratégiques pour les acteurs de la culture. Dans le Web contemporain, l’engagement des institutions culturelles vis-à-vis de leurs publics n’est plus seulement « éditorial » au sens d’un effort qu’elles devraient fournir pour garantir la véracité et la qualité du contenu des documents qu’elles publient, considérant le Web comme un simple média. Cet engagement concerne aujourd’hui tout autant la (co-)production, la structuration et le partage de données, indissociables du substrat technologique du Web, conçu comme un cadre mondial d’échange, d’interopérabilité et d’interconnexion des données. Ces processus engagent le monde institutionnel, en amont et en aval d’une simple « mise en ligne » de documents, marquant un glissement du « porter à connaissance » vers le « (co)-produire la connaissance ». Ainsi, par exemple, les institutions sont aujourd’hui de plus en plus concernées par des problématiques telles que l’attribution d’identifiants mondiaux, répondant aux normes du web sémantique, dont la finalité est d’identifier avec fiabilité les objets dont on parle. Dans le domaine culturel, cette problématique recoupe, entre autres, la question de l’attribution d’identifiants universels aux créateurs d’œuvres d’art. De même, le liage des vocabulaires ouvre des perspectives prometteuses pour la constitution de bases de connaissances interdisciplinaires.
4 Toutes les institutions ne sont pas également impactées par l’essor du web de données. Cependant, sur le plan des risques d’obsolescence technologique comme des opportunités de développement, elles n’ont de marge de manœuvre que si elles s’inscrivent dans un écosystème interinstitutionnel et bénéficient d’un soutien ministériel à l’échelle nationale. C’est dans cette perspective que le MCC a impulsé depuis le début des années 2010 une série de projets et d’actions voués au développement du web de données culturel.
Projets et actions
HDA Lab
5 http://hdalab.iri-research.org
6 L’une de ces premières initiatives a consisté à expérimenter le tagging sémantique sur les référentiels du portail Histoire des arts. Le site HDA Lab, fruit de la collaboration entre le MCC et l’Institut de recherche et d’innovation (IRI), s’appuie ainsi sur DBpédia pour offrir des fonctionnalités de navigation avancée ainsi qu’un accès multilingue à 5 000 ressources pédagogiques relatives à l’histoire des arts.
Semanticpédia
8 Cette première expérimentation a abouti à la signature d’une convention, Semanticpédia, signée en 2012 entre le MCC, l’Institut national de recherche en informatique et en automatique (Inria) et Wikimédia France. Semanticpédia a permis la réalisation de la version francophone de DBpédia.
JocondeLab
9 http://jocondelab.iri-research.org
10 DBpédia en français, qui s’est considérablement enrichi grâce à l’impulsion de Semanticpédia, a donné lieu à une autre expérimentation, JocondeLab. Celle-ci s’est inscrite dans la même lignée qu’HDA Lab. Mis en ligne en 2014, il donne accès en 14 langues (dont le russe, le chinois ou le catalan) à plus de 300 000 notices illustrées extraites de Joconde, catalogue des collections des musées de France. Cette expérimentation s’est appuyée sur le liage sémantique des référentiels de Joconde (adaptés du thésaurus Garnier) avec DBpédia.
Ginco
11 Le programme Hadoc (Harmonisation des données culturelles) [1] vise à harmoniser l’ensemble des bases de données patrimoniales du MCC, notamment en les faisant évoluer vers une description des données plus conceptuelle. Dans ce cadre, un outil de création et gestion de vocabulaires, Ginco, a été développé pour transformer les thésaurus du MCC en référentiels sémantiques exposés en Skos. Ginco donne accès à l’ensemble des vocabulaires scientifiques et techniques produits par le MCC et ses partenaires et s’enrichit progressivement de nouveaux vocabulaires. L’ensemble des vocabulaires peuvent être consultés en ligne, téléchargés au format Skos et interrogés par les machines au moyen du langage de requête SparQL.
Scent for Glam
12 http://scent-glam.eu
13 Sur le plan européen, le MCC a également contribué à sensibiliser et mettre en œuvre le web sémantique dans le contexte des projets européens liés à Europeana, la bibliothèque numérique européenne. Dans un contexte de fait multilingue, le recours aux technologies du web sémantique s’imposait comme une évidence. Le MCC a pris part de 2008 à 2015 aux projets Athena, Linked Heritage et AthenaPlus en coordonnant notamment les groupes de travail dédiés à la terminologie et au multilinguisme. Le projet Athena [2] a permis d’élaborer des recommandations et bonnes pratiques pour transformer les thésaurus classiques en ressources terminologiques compatibles avec les technologies du web sémantique. Les projets Linked Heritage [3] et AthenaPlus [4] ont abouti au développement de Scent for Glam, une plate-forme de gestion collaborative de terminologies qui permet de créer, gérer, aligner des vocabulaires et les exposer en Skos.
IconoLab
14 (projet en cours)
15 Le projet IconoLab, actuellement en cours de développement, est un projet destiné à expérimenter l’indexation collaborative de fonds d’images à l’aide de tags sémantisés. L’expérimentation portera notamment sur l’usage d’indices de fiabilité et de pertinence des tags produits par les contributeurs.
Métadonnées culturelles et transition web 3.0
16 Le MCC a défini une feuille de route [5] publiée en 2014 qui établit 9 axes stratégiques du web de données pour le MCC et ses partenaires institutionnels. À partir de cette feuille de route, une vingtaine d’actions-clés ont été définies ; certaines ont été réalisées, d’autres sont en cours de réalisation ou en phase de décision. Des institutions telles que la Philharmonie de Paris, les Archives nationales ou encore le Musée des civilisations de l’Europe et de la Méditerranées (Mucem) prennent part à ces différentes actions. Cette feuille de route permet de répondre aux enjeux actuels du web des données liées en définissant notamment un programme de formation des personnels du MCC ou encore un partenariat de R&D à venir ou des preuves de concepts démontrant la plus-value de l’interopérabilité sémantique des données pour une meilleure visibilité des collections.
17 L’enjeu pour le MCC est de mener à terme les actions définies dans la feuille de route stratégique. Former et sensibiliser les personnels du MCC et de ses partenaires institutionnels au web sémantique et à ses possibilités constitue une étape cruciale pour décloisonner les données culturelles. Sortir du fonctionnement en silos, croiser les disciplines pour interconnecter et partager données et référentiels est le prochain défi du MCC. Ce décloisonnement des données culturelles a une résonance particulière pour le multilinguisme et la visibilité des contenus culturels, deux éléments majeurs pour le tourisme culturel et le rayonnement du MCC et de ses partenaires à l’international.