Résumé de section

  • Un data paper accompagne l'ouverture d'un jeu de données selon les principes FAIR. Afin d'expliciter les méthodes de collecte, de traitement et de contrôle de qualité des données pour favoriser leur réutilisation, il est alors nécessaire d'assurer la découvrabilité des données via un entrepôt de données. 

    Objectif : identifier les outils de l'écosystème dédié aux données de la recherche.

    5 minutes de lecture


    • Nous allons aborder de nouvelles notions que sont les entrepôts de données, les métadonnées qui peuvent être liées au choix de la revue. En effet dans la description du ou des jeux de données, vous avez pu repérer qu’il convient d’indiquer le nom de l'entrepôt où sont mises à disposition des données de la recherche. 


    • Entrepôt de données : 

      Un entrepôt de données (Data repository ou digital repository) est un réservoir constitué majoritairement de données de recherche, brutes ou élaborées, qui sont décrites par des métadonnées de façon à pouvoir être retrouvées. Ces lieux de stockage permettent :

      1. Le dépôt et la conservation des données.
      2. Le contrôle des droits d’accès aux données, les conditions d’utilisation et la licence.
      3. La recherche, l'affichage et l'export des (méta)données.
      4. L'exploration et la visualisation des données.


    • Les données de recherche déposées dans un entrepôt peuvent être explorées via des outils de visualisation des données. Certains entrepôts mettent à disposition des données sans partager un standard commun. Dans l’exemple suivant de GBIF, ce standard commun permet de visualiser les données de recherche dans un entrepôt qui est mentionné dans le data paper. En effet les revues qui publient les data paper sont liées à cet entrepôt pour la mise à disposition des données. Le data paper permet de documenter l'acquisition, les méthodes, les scripts liés aux données déposées dans l'entrepôt. Un entrepôt est donc un outil qui permet la mise en ligne des données, leur partage, mais aussi leur visualisation dans certains cas.

      Capture d'écran de l'interface de visualisation GBIF
    • On retrouve dans les data paper, comme le Biodiversity data journal, un standard de métadonnées commun à la communauté (Darwin Core) et un lien vers le jeu de données déposé dans un entrepôt. 




      Il est donc important d'avoir en tête qu'en amont de la rédaction d'un data paper, les chercheurs doivent déposer toutes les données et toute la documentation associée.



    • Données publiées

      L’image présente ici la différence entre des données de recherche validées, préservées, citables et créditées. Toute la documentation qui accompagne les données peut varier en fonction du choix de l’outil de mise à disposition des données. Il faut donc distinguer des données “publiées” lorsque les données sont accessibles au public et réutilisables, mais ce terme peut ou non impliquer que les données ont été examinées par des pairs. L’ "examen des données par les pairs" comme nous avons pu le constater précédemment dans les attentes des revues peut être variable. Il en est de même pour un entrepôt de données. 

      La question devient d’autant plus complexe que les données peuvent être dynamiques ou appartenir à une base plus large. Leur enrichissement continu pose alors de nouvelles questions sur ce que sont les données de recherche.

    • Ainsi le choix de l'entrepôt de données et de la revue sont liés. Quelles sont les recommandations de la revue que je choisis en termes de mise à disposition des données ?

      Votre progression : 45 %