Un outil profilé pour la science ouverte
Beaucoup de communautés scientifiques ont besoin de mutualiser leurs données pour avancer dans leurs recherches. C'est le cas par exemple en climatologie, en météorologie ou encore en océanographie. Pour cela, il est nécessaire que les données soient
dans un format lisible quelle que soit la machine utilisée, mais aussi compréhensibles et interprétables pour pouvoir être ré-exploitées.
netCDF a été conçu pour répondre à ces besoins scientifiques. Il permet d'enrichir sémantiquement les données, de faciliter le travail de traitement, d'analyse, le partage et la diffusion des données. Il correspond par essence aux demandes actuelles
du mouvement de la science ouverte. Ce format est recommandé par le pôle Odatis de l’infrastructure de recherche Data Terra, car il procure un cadre de standardisation international qui permet l’interopérabilité, la pérennité et la réutilisation des données.
La science ouverte vise à construire un écosystème dans lequel la science est plus cumulative, plus fortement étayée par des données, plus transparente, et d’accès plus universel.
Dans ce contexte de science ouverte, la diffusion, le partage et la réutilisation des données sont au coeur de la démarche. On parle de gestion de données "FAIR" afin que les données soient Faciles à trouver, Accessibles, Interopérables et Réutilisables.
Pour résumer les principes FAIR :
Findable
Les données doivent être faciles à trouver et identifiables par les humains et les machines :
- Les données doivent figurer dans des catalogues, avec des métadonnées, et des mots clés issus de thésaurus disciplinaires
- Les données doivent être citables et identifiables de manière univoque avec des identifiants uniques et pérennes (DOI)
Accessible
Les données doivent être accessibles facilement, avec des conditions d’accès connues :
- Accompagnées de licences d’utilisation claires, des protocoles ouverts
- Stockées dans des entrepôts de données TRUST clairement accessibles
Interoperable
Les données doivent êtres interopérables à plusieurs niveaux :
- Sémantique : utilisation de vocabulaires contrôlés, métadonnées disciplinaires précises
- Syntaxique : utilisation de protocoles d’échanges inter-machines ouverts et standards (CSW, WMS, SOS, DAP …)
- Contenus : utilisation de formats de fichiers standards disciplinaires (ex : NetCDF, ODV, etc.)
Reusable
Les données doivent êtres réutilisables. C'est l’objectif final des principes FAIR : la pérennité et réutilisation des données. La réutilisation n'est pas possible sans les principes précédents :
- Identifiants uniques et pérennes (DOI) pour l’identification et la citation des données
- Licences claires d’utilisation des données
- Standards communs : protocoles d’échanges et formats standards des données qui répondent à des normes communautaires pertinentes pour le domaine
- Authentification d’accès, si nécessaire
Pour en savoir plus sur les principes FAIR, vous pouvez consulter la présentation ci-dessous.