Bienvenue dans ce parcours destiné aux doctorants et chercheurs en linguistique qui souhaitent découvrir et comprendre pourquoi, comment et quelles données de recherche diffuser en linguistique.
Ce parcours a été pensé et conçu pour être suivi de façon linéaire et progressive, mais aussi de manière fragmentée. Vous pouvez consulter uniquement les parties qui vous intéressent.
Un sommaire s'affiche à la gauche de votre écran et vous permet de naviguer à votre convenance.
Bonne visite !
Si vous rencontrez des difficultés à ouvrir certains liens du cours, essayez de les ouvrir dans un autre navigateur.
Objectifs
Identifier les enjeux liés à l’ouverture des données.
Trier les données diffusables de celles non diffusables.
Sélectionner les données à déposer.
Choisir un entrepôt de données en linguistique adapté à ses besoins.
Préparer le dépôt de ses données dans un entrepôt de données.
Ce cours est en libre accès !
Aucune création de compte ou d'inscription n'est nécessaire, toutefois vous pouvez vous inscrire à ce cours si vous le souhaitez.
Auteur(s) / Formateur(s): Martina OGNIBENE - INALCO, Sara TANDAR - Huma-Num
Production: Lynda KEHLI -DoRANum Inist-CNRS
Public cible: tout public
Date de publication: 28 septembre 2023
Durée estimée: 1h30
Prérequis: aucun
Licence: CC BY-NC-ND
Citation: Ognibene, M. & Tandar, S. & Kehli, L. (2023). La diffusion des données de recherche en linguistique. Callisto Formation. DOI : https://doi.org/10.13143/HNNA-X820
En principe, les données issues d'une activité de recherche financée par des fonds publics (au moins à 50%) doivent être librement accessibles et réutilisables. En dehors de toute obligation, l'ouverture des données de recherche, de manière générale, est fortement encouragée. Cependant, toutes les données ne sont pas diffusables !
Données diffusables et non diffusables
L’accès aux connaissances scientifiques devrait être aussi ouvert que possible. Les restrictions d’accès doivent être proportionnées et justifiées. Elles ne peuvent se justifier que par des motifs de protection des droits humains, de sécurité nationale, de confidentialité, de droit à la vie privée et de respect des sujets d’étude humains, de procédure juridique et d’ordre public, de protection des droits de propriété intellectuelle et des renseignements personnels, des savoirs autochtones sacrés et secrets, ainsi que des espèces rares, menacées ou en danger.
UNESCO - Organisation des Nations Unies pour l’éducation la science et la culture. Recommandation de l’UNESCO sur une science ouverte [En ligne]. UNESCO ; 2021 [cité le 4 mai 2023]. 34 p. Disponible : https://doi.org/10.54677/ltrf8541
Visionnez la vidéo ci-dessous pour en savoir plus sur les données dont la diffusion est soumise à conditions ou impossible.
À noter qu'il est possible d'activer ou de désactiver les sous-titres en allant dans la barre d'outils au démarrage de la vidéo.
L'ensemble des données n'est pas nécessairement destiné à être partagé.
L'équipe de recherche doit sélectionner les jeux de données qu'elle souhaite partager et, pour chacun d'eux, définir les modalités d'accès.
Et en linguistique ?
En tant que chercheur en linguistique, vous êtes susceptible de collecter :
des données à caractère personnel,
des données soumises à un droit de propriété intellectuelle (droit d'auteur, base de données),
des données statistiques.
Avant de déposer de telles données dans un entrepôt et de les diffuser, vous devez vérifier que vous en avez le droit. Dans certains cas, les données pourront être rendues diffusables après avoir subi quelques traitements (anonymisation par exemple). Dans d'autres cas, les données pourront être partagées avec un nombre restreint de personnes. Dans d'autres cas, les données ne seront tout simplement pas diffusables.
Pour davantage d'informations sur les démarches à mettre en place pour être en conformité avec le Règlement Général sur la Protection des Données (RGPG) lorsque l'on est un chercheur en SHS qui traite des données à caractère personnel, n'hésitez pas à consulter le guide "Les SHS et la protection des données à caractère personnel" réalisé par l' InSHS (Institut des sciences humaines et sociales) du CNRS.
Zoom sur des questions juridiques
Cette vidéo, réalisée par l'Université Grenoble Alpes dans le cadre du cours Introduction à la linguistique de corpus, vous apportera des pistes de réflexion sur certaines questions juridiques soulevées par les corpus en linguistique :
Pour déterminer si vos données font l'objet d'une obligation de diffusion, ou au contraire, si leur diffusion est interdite, n'hésitez pas à vous servir de ces outils :
Le logigramme « Typologie des données » et le logigramme « Diffusion des données selon la LRN » produits par le CIRAD, l'INRAE (Institut National de Recherche pour l'Agriculture, l'Alimentation
et l'Environnement), et l'IRD (Institut de Recherche pour le Développement) en annexes 1 et 2 (page 57) de la note méthodologique suivante sur l'ouverture des données de la recherche :
Pour différentes raisons, toutes les données de recherche n'ont pas vocation à être partagées. Il revient au chercheur, qui peut se faire accompagner, de faire un tri dans ses données et de sélectionner celles qui présentent un intérêt pour le partage.
Mais une fois les données sélectionnées, comment faire pour les partager efficacement ? Pour cela, l'idéal est de les déposer dans un entrepôt de données.