Notes
-
[1]
Description du projet World Wide Web, archive disponible de nouveau sur le site du Cern à son adresse d’origine : http://info.cern.ch/hypertext/WWW/TheProject.html
-
[2]
Cf format de livre numérique ePub V.2
- [3]
- [4]
-
[5]
Source : www.bnf.fr/fr/professionnels/anx_web_donnees/a.web_donnees_definitions.html
-
[6]
« Web sémantique, web de données… Quelle nouvelle donne ? » Dossier. Documentaliste-Sciences de l’information, 2011, n° 4.
-
[7]
En 2015, la revue a changé de nom pour devenir I2D – Information, données & documents.
1 Lorsqu’en 1990 le physicien britannique Tim B. Lee a mis en ligne depuis le Cern la page hypertexte originelle [1], son objectif était de permettre aux scientifiques travaillant dans les structures du monde entier d’échanger des informations instantanément. La page créée au moyen d’un langage à balises simple était interprétée par un navigateur, interface graphique pensée pour encourager l’adoption du système par la communauté. C’est le centre de documentation de l’entité de calcul du Cern qui a été pionnier en la matière avec l’implémentation de ce nouveau dispositif. Il est donc certain que l’aspect documentaire fut l’un des premiers objectifs poursuivis par les initiateurs du Web.
2 Au départ, le langage de formalisation SGML était utilisé par le Cern pour sa documentation. Cette approche rigoureuse semblait trop complexe pour un échange à grande échelle. Le HTML initial, inspiré du SGML, avec une approche simple orientée présentation, mêlait le fond et la forme : il tendait vers une vision plus communicationnelle que documentaire des flux d’informations. Cependant, dans les approches métiers et pour des logiques computationnelles, le besoin de données strictement formalisées s’est fait rapidement ressentir. Un autre héritier du SGML exclusivement orienté structure de données est apparu en 1998 comme préconisation du W3C : le XML. Un effort de synthèse entre la présentation du HTML et la structuration XML a été tenté dès 2000 avec le xHTML offrant quelques réussites dans le monde de l’édition en ligne [2].
3 Conscient que le potentiel de liaison des données ne se limitait pas à la présentation hypertextuelle, Tim Berners Lee pressent dès 1994 que le Web doit devenir sémantique pour se lier au réel [3]. En 1998, il propose une feuille de route [4] et, en 2001, publie son article « The semantic web » avec le cadrage conceptuel et technologique complet. Dans un premier temps, les applications pratiques sont restées confidentielles pour le grand public, limitées au monde de la recherche et du développement avec des chevilles ouvrières telles que l’Inria, le W3C ou des sociétés comme Mondeca. La donne a changé depuis le début des années 2010 avec le développement du web de données publiques dont les acteurs initiaux majeurs furent DPpedia, Freebase ou la BBC [5]. L’ouverture de ces données, leur description formalisée offrent la possibilité de lier les contenus entre eux et d’enrichir des dispositifs tiers, de faire de l’inférence, de générer de la connaissance par le raisonnement sémantique.
4 Ce dossier se veut un prolongement de celui publié fin 2011 dans la revue Documentaliste-Sciences de l’information [6] [7] et permet d’observer le chemin accompli. Nous reviendrons sur les fondamentaux des objectifs, pratiques, normes et formats liés au web de données. L’éclairage sur la thématique sera décliné en trois pôles qu’il nous semble pertinent de mettre en valeur au prisme des thématiques de cette revue : l’information, les données et les documents.
5 Nous entamerons ce dossier par une présentation du web de données dans le contexte des bibliothèques avec un rappel des enjeux et quelques exemples concrets d’applications documentaires de bibliothéconomie ou de mutualisation de connaissances permises par les principes et techniques du web de données. Nous prêterons ensuite attention aux bénéfices certains apportés par le web sémantique au domaine scientifique et à la valorisation possible des données culturelles par des dispositifs numériques adaptés. Enfin, les nouveaux usages liés au web de données dans la recherche et le développement retiendront notre attention, que ce soit dans la recherche médicale, le droit ou sur le plan de l’optimisation de l’indexation ou de la proposition de contenus personnalisés.
Notes
-
[1]
Description du projet World Wide Web, archive disponible de nouveau sur le site du Cern à son adresse d’origine : http://info.cern.ch/hypertext/WWW/TheProject.html
-
[2]
Cf format de livre numérique ePub V.2
- [3]
- [4]
-
[5]
Source : www.bnf.fr/fr/professionnels/anx_web_donnees/a.web_donnees_definitions.html
-
[6]
« Web sémantique, web de données… Quelle nouvelle donne ? » Dossier. Documentaliste-Sciences de l’information, 2011, n° 4.
-
[7]
En 2015, la revue a changé de nom pour devenir I2D – Information, données & documents.