Bienvenue dans ce parcours destiné aux doctorants et chercheurs en linguistique qui souhaitent découvrir et comprendre pourquoi, comment et quelles données de recherche diffuser en linguistique.
Ce parcours a été pensé et conçu pour être suivi de façon linéaire et progressive, mais aussi de manière fragmentée. Vous pouvez consulter uniquement les parties qui vous intéressent.
Un sommaire s'affiche à la gauche de votre écran et vous permet de naviguer à votre convenance.
Bonne visite !
Si vous rencontrez des difficultés à ouvrir certains liens du cours, essayez de les ouvrir dans un autre navigateur.
Objectifs
Identifier les enjeux liés à l’ouverture des données.
Trier les données diffusables de celles non diffusables.
Sélectionner les données à déposer.
Choisir un entrepôt de données en linguistique adapté à ses besoins.
Préparer le dépôt de ses données dans un entrepôt de données.
Ce cours est en libre accès !
Aucune création de compte ou d'inscription n'est nécessaire, toutefois vous pouvez vous inscrire à ce cours si vous le souhaitez.
Auteur(s) / Formateur(s): Martina OGNIBENE - INALCO, Sara TANDAR - Huma-Num
Production: Lynda KEHLI -DoRANum Inist-CNRS
Public cible: tout public
Date de publication: 28 septembre 2023
Durée estimée: 1h30
Prérequis: aucun
Licence: CC BY-NC-ND
Citation: Ognibene, M. & Tandar, S. & Kehli, L. (2023). La diffusion des données de recherche en linguistique. Callisto Formation. DOI : https://doi.org/10.13143/HNNA-X820
Partager les données de la recherche est un des enjeux-clés de la science ouverte. Plus qu'une injonction politique et institutionnelle, l'ouverture des données de recherche peut présenter de nombreux intérêts pour un chercheur, et pour la science !
L'ouverture des données
Retrouvez dans cette ressource l'essentiel de ce qu'il y a à savoir à ce sujet :
Partage de données en linguistique
La vidéo ci-dessous relate l'histoire vraie d'un corpus, aujourd'hui très connu, partagé par ses créateurs il y a plusieurs décennies...
À noter qu'il est possible d'activer ou de désactiver les sous-titres en allant dans la barre d'outils au démarrage de la vidéo.
En rendant le Brown Corpus accessible, ses créateurs ont permis à d'autres chercheurs de créer, à partir de son modèle, d'autres corpus ou encore, de produire d'autres types de données, d'alimenter d'autres recherches. Le Brown Corpus est devenu un corpus de référence. Il est, aujourd'hui encore, réutilisé dans de nombreux domaines scientifiques.
Après une histoire vraie, voici une seconde histoire qui pourrait être vraie.
N'hésitez pas à mettre les images en mode plein écran pour mieux voir le texte.
L'ouverture et le partage des données est une des clés pour permettre et accélérer l'innovation scientifique. En linguistique, il est très courant de s'appuyer sur des données produites ou récoltées par d'autres (chercheurs ou non, en linguistique ou dans une autre discipline) pour produire de nouvelles données et de nouveaux résultats de recherche. Pour que ce cycle de la réutilisation perdure, il revient à chacun de diffuser à son tour les données de recherche qu'il peut partager...