Ré-utilisation des données de la recherche
-
Pourquoi rechercher des données existantes ?
Dans le cadre du mouvement de la Science Ouverte, il est de plus en plus demandé aux chercheurs de rendre ses données de recherche aussi réutilisables que possible. L’ouverture des données vous permet également d'utiliser les données d'autres personnes. Avant de commencer votre projet, vérifiez si les données dont vous avez besoin sont déjà disponibles ou si des données similaires existent. Évaluez ensuite si les données existantes sont suffisantes pour mener ou compléter votre recherche. Il est intéressant d'utiliser les données existantes pour plusieurs raisons :
• Vous pouvez gagner du temps en n'ayant pas à collecter de données déjà existantes.
• Vous pouvez utiliser des données préexistantes pour effectuer des comparaisons.
• Elles peuvent vous inspirer pour effectuer d'autres analyses. -
Où chercher des données existantes ?
1/ À partir d'un article publié
À la fin d'un article, vous pouvez retrouver un lien vers les données utilisées pour rédiger l'article. Ce lien a un identifiant pérenne (ex : DOI) et se trouve souvent dans une catégorie appelée "supplementary data". C'est une pratique encore rare mais qui devrait se développer de plus en plus.
2/ En cherchant dans des entrepôts multidisciplinaires
- Zenodo : entrepôt de jeu de données de recherche, issu du projet européen OpenAIREplus et du CERN ; il est possible de recherche un jeu de données ou d’en déposer. Plus de 2000 sont référencés ;
- Figshare : entrepôt de jeu de données de recherche multidisciplinaire.
3/ En cherchant dans des entrepôts thématiques
- Dryad Digital Repository : plateforme de données de la recherche dans les domaines de la médecine et de la biologie ;
- PANGAEA : plateforme de données de la recherche dans les domaines des sciences de la terre et de l’environnement ;
- International Virtual Observatory Alliance (IVOA) : entrepôt de jeu de données de recherche dans le domaine de l’astronomie ;
- Interuniversity Consortium for Political and Social Research (ICPSR) : entrepôt de jeu de données de recherche dans le domaine des sciences sociales.
4/ En cherchant dans des annuaires d'entrepôts
5/ En utilisant des moteurs de recherche dédiés aux données
6/ À partir de data papers
Vous pouvez faire une veille sur ces data journals via flux RSS ou alerte mail.
Il en existe encore très peu ou ils sont peu alimentés, particulièrement en sciences humaines et sociales. On peut tout de même citer :
- Data in Brief par Eslevier est le plus développé actuellement ;
- Research Data Journal for the Humanities and Social Sciences spécialisé en sciences humaines et sociales.
- Zenodo : entrepôt de jeu de données de recherche, issu du projet européen OpenAIREplus et du CERN ; il est possible de recherche un jeu de données ou d’en déposer. Plus de 2000 sont référencés ;
-
Appliquer les conditions d’utilisation mentionnées dans les licences
-
Citer un jeu de données
Le format minimal d’une référence bibliographique d’un jeu de données comporte 5 éléments (recommandation de DataCite, consortium international dont l’objectif est de faciliter l’accès aux données de la recherche et leur réutilisation) :
- Auteur (Année de publication) : Titre. Editeur. IdentifiantCreator (PublicationYear): Title. Publisher. Identifier
Ce format minimal peut être complété, si besoin, par la version et le type de ressource :
- Auteur (Année de publication) : Titre. Version. Editeur. Type de ressource. IdentifiantCreator (PublicationYear): Title. Version. Publisher. ResourceType. Identifier
Vous pouvez générer automatiquement une référence créée à partir du DOI du jeu de données via l’application en ligne DOI Citation Formatter développée par DataCite et CrossRef. Cette application offre la possibilité de personnaliser votre citation parmi 500 styles de citation de revues scientifiques.
À noter que certains formats bibliographiques ne respectent pas encore les recommandations de mars 2017 de Crossref pour écrire un DOI dans une référence bibliographique sous la forme d’un lien commençant par https://doi.org/
Quels logiciels gèrent les références bibliographiques de jeux de données ?
- Le logiciel bibliographique commercial EndNote ( version X4) propose le type de référence Data Set.
- Zotero n’a pas de type de référence pour décrire les jeux de données. Les références de jeux de données importées dans une bibliothèque Zotero apparaissent sous le type Document.
- Mendeley n’a pas de type de document spécifique pour gérer les références de jeux de données. Le type Generic peut être choisi comme substitut.