Résumé de section

    • Il y a donc un nombre important d'entrepôts que l'on peut classer dans des grandes catégories (selon les disciplines / projets / éditeurs concernés...). Ce critère peut déjà vous orienter si vous cherchez un entrepôt de données. Par exemple si vous êtes chercheur en sciences de l'éducation, l'entrepôt Nakala (SHS) sera déjà plus adapté que l'entrepôt Pangea (science de la terre et de l'environnement). 

      Si ce critère permet déjà de restreindre les choix, d'autres critères plus fins et propres à chaque contexte peuvent aussi être pris en compte : vous faut-il un entrepôt certifié ? permettant de modifier les données et accéder aux anciennes versions ? proposant des licences de diffusion... ? 

      Pour vous guider dans votre choix, nous allons maintenant regarder tous les points que vous devriez prendre en compte afin de trouver l’entrepôt le mieux adapté à votre situation.


    • Les recommandations d'entrepôt

      Il se peut qu’une recommandation soit faite par une partie prenante du projet (financeur, université, organisme de recherche) ou une des revues dans laquelle vous souhaitez publier. Une des premières choses à faire est donc de vérifier si vous avez des recommandations.





    • Les annuaires d'entrepôt

      Comme nous l’avons vu un peu avant, il existe des annuaires (ou répertoires) qui recensent des entrepôts et permettent une recherche par filtre. En voici quelques-uns.


      Annuaires multidisciplinaires
      Cat OPIDoR

      C'est un catalogue qui a pour objectif de cartographier les services français dédiés aux données scientifiques. Hébergé par l’Inist-CNRS qui assure la modération, il complète l'offre de services OPIDoR. 

      Une liste dédiée aux entrepôts de données français est disponible ici.


      re3data (Registry of Research Data Repositories)

      C'est un registre mondial d'entrepôts de données de recherche qui couvre les dépôts de différentes disciplines universitaires. Il comprend des dépôts qui permettent le stockage permanent et l'accès aux ensembles de données aux chercheurs, aux organismes de financement, aux éditeurs et aux institutions savantes. re3data promeut une culture de partage, un accès accru et une meilleure visibilité des données de recherche.


      OAD (Open Access Directory)

      OAD est un wiki où la communauté du libre accès peut créer et soutenir des listes factuelles simples sur le libre accès à la science et aux études. 

      Une liste dédiée aux entrepôts de données est disponible ici.


      Annuaires spécialisés

      FAIRsharing

      C'est une ressource informative et éducative sur les normes en matière de données et de métadonnées, en relation avec les bases de données et les politiques en matière de données. Une page est dédiée à la recherche d'entrepôts contenant plusieurs filtres (par discipline, domaine, recommandation, pays...).


      NIH (National Institutes of Health)

      Depuis plusieurs années, le BIMC (BioMedical Informatics Coordinating Committee) tient à jour sur ce site une liste d'entrepôts de données soutenus par les NIH :


      Annuaires mixtes

      OpenDOAR

      C'est un répertoire mondial d'entrepôts et archives ouvertes en libre accès, dont la qualité est garantie. Vous pouvez rechercher et parcourir des milliers d'entrepôts enregistrés en fonction d'une série de caractéristiques, telles que l'emplacement, le logiciel ou le type de matériel détenu.


      ROAR (Registry of Open Access Repositories)

      L'objectif de ROAR est de promouvoir le développement du libre accès en fournissant des informations opportunes sur la croissance et le statut des entrepôts et archives ouvertes à travers le monde.


    • D'autres critères

      En parallèle ou complément d'éventuelles recommandations, vous pouvez vous appuyer sur cette liste de critères qui pourra vous aider lors de vos recherches.

      Critères que l'on peut retrouver dans les annuaires

      Les annuaires d’entrepôts proposent certains filtres qui pourraient vous aider à trouver un entrepôt :

      • Disciplinaire ?
        • L’annuaire re3data par exemple permet de trier par domaine / sous domaine. L’annuaire spécialisé FAIRsharing permet de cibler très finement votre thématique de recherche. La liste OAD classe les entrepôts par disciplines.
      • Certifié / Reconnu ?
        • L’annuaire re3data par exemple permet de trier par type de certification.
      • Permettant de restreindre l’accès ?
        • Il y a un filtre « data access » dans l’annuaire re3data par exemple.
      • Permettant de modifier les données et accéder aux anciennes versions ?
        • Il y a un filtre « versionning » dans re3data par exemple
      • Attribuant un identifiant pérenne aux données ?
      • Proposant des licences de diffusion ?
      Informations que l'on peut trouver dans les pages de politique des entrepôts

      Certaines informations sont à vérifier dans les pages de politique de l’entrepôt, comme par exemple :

      • Le lieu d’hébergement du serveur
      • La préservation sur le long terme des données
      • Le coût du dépôt
        • Pour déposer dans certains entrepôts comme Dryad vous, votre institution ou votre éditeur devez vous acquitter de charges de publication. Le coût peut également être lié au volume de vos fichiers. Zenodo par exemple est gratuit pour les données hétérogènes (longue traîne des données).
      • Le statut public / privé de l’entrepôt
      • Les types de données acceptés
        • Certains entrepôts, comme Dryad, n’acceptent que les données liées à une publication. D’autres entrepôts, comme Zenodo, acceptent tout type de données.
      • Les formats de fichiers acceptés
        • L’entrepôt peut préconiser des formats de fichiers spécifiques. Par exemple, l’entrepôt Dryad accepte tout format mais recommande l’utilisation de formats non propriétaires et liste les formats à privilégier.
      • Le lien avec la publication de l’article
      Autres aspects à vérifier

      Enfin, certains aspects ne sont vérifiables qu’en naviguant sur le site de l’entrepôt. En allant visiter les sites d’entrepôt, vous pourrez notamment vérifier :

      • La facilité du dépôt
        • Est-ce que le site de l’entrepôt est simple d’utilisation, convivial, ergonomique ? Est-ce que le formulaire de dépôt est simple à compléter ? Certains entrepôts proposent également un accompagnement, des tutoriels pour vous aider dans le dépôt des données.
      • Les statistiques d’utilisation
        • L’entrepôt propose-t-il des statistiques d’utilisation, de consultation, de téléchargement ?
      • La qualité de la description (métadonnées)
        • La qualité de la description des jeux de données est importante pour permettre de les retrouver facilement. La plupart des entrepôts s’appuient sur des standards pour décrire les données.

    • Exercice : trouver l'entrepôt de données le plus adapté


      Le but de cet exercice est de retrouver sur l'annuaire re3data un ou plusieurs entrepôts qui pourraient convenir à la situation d'un chercheur souhaitant déposer ses données.