Bienvenue dans ce parcours destiné aux doctorants et chercheurs en linguistique qui souhaitent découvrir et comprendre pourquoi, comment et quelles données de recherche diffuser en linguistique.
Ce parcours a été pensé et conçu pour être suivi de façon linéaire et progressive, mais aussi de manière fragmentée. Vous pouvez consulter uniquement les parties qui vous intéressent.
Un sommaire s'affiche à la gauche de votre écran et vous permet de naviguer à votre convenance.
Bonne visite !
Si vous rencontrez des difficultés à ouvrir certains liens du cours, essayez de les ouvrir dans un autre navigateur.
Objectifs
Identifier les enjeux liés à l’ouverture des données.
Trier les données diffusables de celles non diffusables.
Sélectionner les données à déposer.
Choisir un entrepôt de données en linguistique adapté à ses besoins.
Préparer le dépôt de ses données dans un entrepôt de données.
Ce cours est en libre accès !
Aucune création de compte ou d'inscription n'est nécessaire, toutefois vous pouvez vous inscrire à ce cours si vous le souhaitez.
Auteur(s) / Formateur(s): Martina OGNIBENE - INALCO, Sara TANDAR - Huma-Num
Production: Lynda KEHLI -DoRANum Inist-CNRS
Public cible: tout public
Date de publication: 28 septembre 2023
Durée estimée: 1h30
Prérequis: aucun
Licence: CC BY-NC-ND
Citation: Ognibene, M. & Tandar, S. & Kehli, L. (2023). La diffusion des données de recherche en linguistique. Callisto Formation. DOI : https://doi.org/10.13143/HNNA-X820
Les données de la recherche sont définies comme des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de recherche.
OCDE. Principes et lignes directrices de l'OCDE pour l'accès aux données de la recherche financée sur fonds publics [En ligne]. OECD Publishing ; 2007 [cité le 1 fév 2023]. 49 p. Disponible : https://doi.org/10.1787/9789264034020-en-fr.
Données en linguistique
En linguistique, on parle plus volontiers de ressources linguistiques que de données.
Dans cette discipline, il existe une grande variété de domaines de recherche. De la phonétique à la linguistique informatique en passant par la neurolinguistique, les données en linguistique peuvent être aussi variées que ses domaines de recherche.
Par exemple, voici une liste (non-exhaustive) de données potentielles en linguistique :
En linguistique, lorsque l'on parle de ressources (de données), on pense le plus souvent aux corpus. Cependant, selon le domaine de recherche, les données peuvent aussi prendre d'autres formes (enregistrements, mesures, codes, images...). Mais pourquoi un chercheur devrait-il les partager ?