Résumé de section

  • Dans le cadre de la structuration des projets de recherche, la gestion des flux de données en Biologie et en Bio-Informatique est un enjeu majeur pour les chercheurs qui devront mettre en place une organisation allant de la génération des données jusqu'à leur pérennisation, en passant par leur analyse. Dans un tel objectif, l'identification des infrastructures de génération, d'analyse et de pérennisation des données mais également l'adoption de bonnes pratiques de gestion de données est essentielle.

    • Le Data Management Plan

      Pour mieux structurer ses projets, la rédaction d'un plan de gestion des données (PGD ou DMP pour Data Management Plan) est un outil très précieux puisqu'il va permettre d'aborder un grand nombre de questions liées à la gestion des données. En s'intéressant initialement à la description des données créées ou réutilisées, à leur format et à leurs standards, en questionnant les aspects éthiques ou de confidentialité, en considérant leur partage et leur ouverture ainsi que leur conservation sur le long terme, le DMP va aider le scientifique à mieux structurer son approche de la donnée en prenant également en compte certains aspects techniques indispensables.

      Le DMP se présente sous forme d’un document structuré en rubriques. Il a pour objectif de synthétiser la description et l’évolution des jeux de données d'un projet de recherche.

    • Informations administratives

      Financement du projet, contributeurs...

      Description des données

      Façon dont les données ont été recueillies, créées, réutilisées...

      Sécurité des données

      Mesures prises pour assurer la sécurité des données...

      Stockage et sauvegarde

      Endroit où les données sont stockées durant le projet, fréquence des sauvegardes...

      Documentation, métadonnées, standards

      Standard de métadonnées utilisé, mode d'organisation des données...

      Partage et accessibilité

      Choix des données à partager, condition de partage, licence...

      Archivage

      Sélection des données à conserver sur le long terme, choix de l'entrepôt ou archive...

      Aspects juridiques et éthiques

      Traitement des données à caractère personnel, respect des dispositions  légales...

      Coûts

      Frais de stockage, coût matériel, frais d’entrepôt et d'archivage...

      Exemple générique de rubriques pouvant se retrouver dans un plan de gestion de données


    • Quelques ressources utiles pour la mise en place d'un DMP

      Pour la mise en place du DMP, il est possible de bénéficier d'aide, de formation et également de nombreuses ressources en ligne afin d'aborder au mieux cette étape de conceptualisation du projet sous l'angle de la donnée.

    • Des ressources d'auto-formation

      Voici quelques ressources d'auto-formation accessibles librement :

      DoRANum

      Une plateforme de formation sur la gestion et le partage des données de la recherche réalisée par l’Inist-CNRS et le GIS Réseau Urfist.

      RDMkit

      Une boîte à outils sur la gestion des données de recherche développée au sein du projet ELIXIR-CONVERGE.

      FAIRcookbook

      Diverses recettes pour une démarche FAIR.

      The Turing Way

      Une ressource pour la mise en place d'une science des données reproductible, éthique et collaborative.

    • Les articles Ten simple rules

      La série des Ten simple rules du PLOS permet aussi d'aborder rapidement les différents aspects d'une problématique.

      Dix règles simples pour
      Créer un bon plan de gestion des données

      Voir l'article

      Dix règles simples pour
      Le stockage des données numériques

      Voir l'article

      Dix règles simples pour
      Une recherche informatique reproductible

      Voir l'article

      Dix règles simples pour
      Améliorer la découverte des données de recherche

      Voir l'article

      Dix règles simples pour
      Le traitement des données à grande échelle

      Voir l'article

      Dix règles simples pour
      Rendre les supports de formation FAIR

      Voir l'article

      Dix règles simples pour
      Utiliser les données biologiques publiques pour votre recherche

      Voir l'article

    • Les Ateliers de la donnée

      Pour une aide plus directe, il est possible de contacter les Ateliers de la donnée. Mis en place au sein de l'écosystème Recherche Data Gouv, une structuration nationale se met en place. En 2023, on dénombre 15 ateliers, probablement rejoints par d'autres en 2024 à la faveur de nouveaux appels à labellisation.


    • Les outils d'aide à la rédaction

      On constate à l’heure actuelle, avec la généralisation des démarches de Science Ouverte, avec l’adoption des principes FAIR, l’émergence de nombreux outils d’assistance à la rédaction d’un DMP. En voici une liste non exhaustive.


    • Conseils pour choisir son outil de DMP

      Devant une telle profusion d'outils à la fonction similaire, se pose la question de la sélection d'un outil pour élaborer un plan de gestion des données ? Il suffit de rester pragmatique, le choix peut être guidé par :

      • Les recommandation des financeurs (par exemple, l'ANR demandera OPIDoR) ;
      • les partenaires du projet.

      Pour identifier et sélectionner un outil d'aide à la rédaction de DMP, on peut conseiller la lecture d'un article comparatif rédigé par le GTSO Données du Consortium Couperin s'intéressant aux trois outils: Argos, DMP-OPIDoR, DSW.


    • Autres outils de gestion

      Dans le cas de projets incluant une composante de développement logiciel, il faut garder à l'esprit qu'existent désormais des Plans de Gestion des Logiciels (Software Management Plan : SMP). Le réseau ELIXIR promeut la mise en place de SMP dans le domaine de la Bio-Informatique et dispose d'une page où sont consultables les travaux.

      Parallèlement à l'utilisation d'outils de planification tels que les DMP ou les SMP, l'outil SEEK, développé dans le cadre du projet FAIRDOM, peut être d'une grande aide pour mieux structurer la gestion des données dans une perspective de partage et de collaboration. FAIRDOM-SEEK est une plate-forme de catalogage et de communs open source, basée sur le Web, permettant de partager des ensembles de données de recherche hétérogènes, des modèles ou des simulations, des processus et des résultats de recherche. Il préserve les associations entre eux, ainsi que des informations sur les personnes et les organisations. Il permet de capturer les divers éléments clés d'un projet de recherche en les représentant sous forme graphique. 


      Description précisée dans la légende ci-dessous.

      Vue graphique offerte par SEEK permettant de visualiser l'arborescence ISA (Investigation Study Assay).