Choisir un entrepôt de données.
Je dirais même plus : Choisir un entrepôt thématique de confiance !
Dans le cas de disciplines structurées pour le partage des données (astronomie, génomique, etc.), les producteurs et productrices de données ont à disposition des entrepôts spécifiques à leur discipline. Ils et elles utiliseront alors naturellement l’ensemble des standards et bonnes pratiques déjà en place pour documenter et mettre en forme leurs données.
En alternative, les producteurs et productrices de données pourront se tourner vers l’entrepôt institutionnel auquel ils et elles sont affilié.e.s, s’il existe, ou utiliser l’entrepôt pluridisciplinaire Recherche Data Gouv qui propose des espaces institutionnels.
Des exigences minimales seront imposées par ces entrepôts de confiance pour que les données soient FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable) notamment grâce à l’attribution d’un identifiant pérenne unique (par exemple un DOI). Vous trouverez des conseils dans la fiche synthétique Dépôts et entrepôts.
La pratique de sa communauté est le meilleur guide, mais des annuaires de ces entrepôts existent. L'annuaire re3data recense les entrepôts et permet de visualiser (ou de sélectionner) les plus adaptés par filtrage sur plusieurs critères (par exemple la discipline, l’attribution d’un identifiant pérenne aux jeux de données, les types de données ou de formats acceptés, la préservation sur le long terme des données, le choix de la licence, etc.).
Entrepôts thématiques
Le collège Données de la
recherche du CoSO (Comité pour la Science Ouverte) a produit une note méthodologique pour sélectionner un entrepôt thématique de confiance : méthodologie et analyse de l'offre existante pour la diffusion des données de
recherche. Cette note propose donc une méthode d’identification des entrepôts thématiques recommandés, assortie d’une première liste non exclusive découlant de la grille de critères d’analyse retenus. Elle s’appuie sur les travaux engagés dès 2022 par le Collège des données de la recherche du Comité pour la science ouverte. Spécifiquement missionné par le ministère de l’Enseignement supérieur et de la Recherche, le Collège des données de la recherche a été chargé d’établir une liste de critères propres à guider la sélection des entrepôts thématiques de confiance permettant le dépôt et la publication de jeux de données, en prenant prioritairement en compte les disciplines les plus actives/structurées sur la gestion des données.
Vous pouvez consulter également ce logigramme à retrouver sur Recherche Data Gouv pour vous permettre d'identifier où publier votre jeu de données.
Pour toute question, s’adresser à l’atelier de la donnée de proximité ou contacter le Centre de ressources entrepôt-catalogue Recherche Data Gouv (RDG).
Dans le cas où les données soutiennent une publication scientifique et
pour des besoins de preuves, il est important de choisir un entrepôt tel
que celui de Recherche Data Gouv qui permet d’accéder de manière pérenne et fiable à la version du jeu de données qui a servi à l’obtention des résultats.