Dans le cadre du mouvement de la Science Ouverte, il est de plus en plus demandé aux chercheurs de rendre ses données de recherche aussi réutilisables que possible. L’ouverture des données vous permet également d'utiliser les données d'autres personnes.
Avant de commencer votre projet, vérifiez si les données dont vous avez besoin sont déjà disponibles ou si des données similaires existent. Évaluez ensuite si les données existantes sont suffisantes pour mener ou compléter votre recherche. Il est
intéressant d'utiliser les données existantes pour plusieurs raisons : • Vous pouvez gagner du temps en n'ayant pas à collecter de données déjà existantes. • Vous pouvez utiliser des données préexistantes
pour effectuer des comparaisons. • Elles peuvent vous inspirer pour effectuer d'autres analyses.
Où chercher des données existantes ?
1/ À partir d'un article publié
À la fin d'un article, vous pouvez retrouver un lien vers les données utilisées pour rédiger l'article. Ce lien a un identifiant pérenne (ex : DOI) et se trouve souvent dans une catégorie appelée "supplementary data". C'est une pratique encore
rare mais qui devrait se développer de plus en plus.
2/ En cherchant dans des entrepôts multidisciplinaires
Zenodo : entrepôt de jeu de données de recherche, issu du projet européen OpenAIREplus et du CERN ; il est possible de recherche un jeu de données ou d’en déposer. Plus de 2000 sont référencés ;
Figshare : entrepôt de jeu de données de recherche multidisciplinaire.
3/ En cherchant dans des entrepôts thématiques
Dryad Digital Repository : plateforme de données de la recherche dans les domaines de la médecine et de la biologie ;
PANGAEA : plateforme de données de la recherche dans les domaines des sciences de la terre et de l’environnement ;
Appliquer les conditions d’utilisation mentionnées dans les licences
Citer un jeu de données
Le format minimal d’une référence bibliographique d’un jeu de données comporte 5 éléments (recommandation de DataCite, consortium international dont l’objectif est de faciliter l’accès aux données de la recherche et leur réutilisation) :
Ce format minimal peut être complété, si besoin, par la version et le type de ressource :
Auteur (Année de publication) : Titre. Version. Editeur. Type de ressource. IdentifiantCreator (PublicationYear): Title. Version. Publisher. ResourceType. Identifier
Vous pouvez générer automatiquement une référence créée à partir du DOI du jeu de données via l’application en ligne DOI Citation Formatter développée par DataCite et CrossRef. Cette
application offre la possibilité de personnaliser votre citation parmi 500 styles de citation de revues scientifiques. À noter que certains formats bibliographiques ne respectent pas encore les recommandations de mars 2017 de Crossref pour écrire un DOI dans une référence bibliographique sous la forme d’un lien commençant par https://doi.org/
Quels logiciels gèrent les références bibliographiques de jeux de données ?
Le logiciel bibliographique commercial EndNote ( version X4) propose le type de référence Data Set.
Zotero n’a pas de type de référence pour décrire les jeux de données. Les références de jeux de données importées dans une bibliothèque Zotero apparaissent sous le type Document.
Mendeley n’a pas de type de document spécifique pour gérer les références de jeux de données. Le type Generic peut être choisi comme substitut.