Notes
1 La toxicologie entre en 2005 en quête d’une sémantique commune pour favoriser les collaborations interdisciplinaires propices à l’émergence de nouveaux travaux. Le schéma du référentiel qui en résulte, OntoToxNuc, traduit cette ambition plus que le processus de la toxicité lui-même. L’enjeu est ensuite d’implémenter cet ensemble structuré d’informations dans des applications tierces, favorable à l’identification et au contact de potentiels collaborateurs. L’idée est aussi que ce référentiel permette de sélectionner et d’indexer des données d’intérêt, mais également d’accéder aux publications issues de ToxNuc et stockées sur sa plate-forme web dédiée tout en améliorant la navigation et la recherche sur celle-ci.
Méthodes de conception et formalisme
2 Le comité de pilotage recourt à des chercheurs en SIC pour co-construire un référentiel commun grâce à plusieurs dispositifs sociotechniques [1]. Le référentiel identifie les disciplines, domaines scientifiques, organismes (végétaux, mammifères, etc.), modèles biologiques (espèces), toxiques étudiés, molécules, instruments, méthodes et, enfin, publications surveillées par les chercheurs. Ces divers éléments sont comme autant de micro-thésaurus qui rassemblent une terminologie arborescente de 1 200 termes. En 2011, le référentiel OntoToxNuc est encodé au format OWL pour typer les relations sémantiques entre les 649 concepts qui s’en dégagent. Des éléments y sont aussi incorporés au format Skos pour contrôler le vocabulaire anglais-français exprimant les concepts.
Réingénierie orientée web de données : une opportunité de valorisation
3 Lors de sa réingénierie en 2014, ce référentiel, déjà conforme au standard d’interopérabilité RDF, est envisagé à l’échelle du Linked Open Data (LOD). Le nouvel enjeu pour OntoToxNuc est de valoriser la communauté menée par la France, dont les travaux sont pionniers en toxicologie nucléaire environnementale. Son assise institutionnelle lui confère déjà légitimité, stabilité et pérennité, soit des gages de confiance à consolider via des dispositions juridiques et organisationnelles. Sa visibilité est à même de renforcer comme autant d’atouts géopolitiques la présence du CEA et de la langue française dans le LOD.
Bonnes pratiques pour le partage de schémas
4 L’essence d’un référentiel sémantique est d’être relationnel, a fortiori dans l’écosystème LOD. Pour alimenter les définitions des concepts et fournir des labels supplémentaires, les critères d’évaluation des référentiels sont leur connectivité avec d’autres référentiels pivots reconnus dans leur domaine ou les domaines proches comme ici avec CHEBI, MeSH, NCIt [2]. Il s’agit d’indiquer les équivalences entre les éléments qui les composent (alignements) et de faire d’OntoToxNuc un objet composite et modulaire dans lequel puissent se combiner différentes parties d’autres référentiels (mash-up). Recouper les informations sur les données diminue les coûts de production, tout en permettant de présenter une vision agrégée et cohérente des données elles-mêmes pour accroître les connaissances. L’évaluation des relations sémantiques, fixées pour rendre opérable le référentiel, sera plus aisée si les objectifs et usages potentiels du référentiel sont documentés et s’il incorpore ses métadonnées (certains des 15 éléments Dublin Core, certaines classes, propriétés et annotations OWL) qui « documentarisent » son contexte de création et ses évolutions.
5 OntoToxNuc a une valeur épistémologique car sa genèse retrace aussi celle de la communauté de la toxicologie nucléaire environnementale. L’enrichissement, la spécification plus poussée de la représentation du domaine et l’affiliation aux référentiels biomédicaux pivots participeraient d’une stratégie de valorisation déjà initiée par le dépôt d’OntoToxNuc sur BioPortal [3].