• Puis-je ouvrir les données ?


    • LE SAVIEZ-VOUS ?

      La science ouverte n'implique pas l'ouverture de TOUTES les données. INRAE propose des outils et des services pour vous accompagner.

      OBJECTIF PÉDAGOGIQUE

      A l'issue de cette rubrique, vous serez en mesure de définir le degré et les modalités d'ouverture/fermeture de vos données. Nous vous conseillons d'avoir suivi la rubrique "Qu'est-ce que les données ? " au préalable.

       DURÉE
                 
      30 minutes
    • Aussi ouvert que possible, pas plus fermé que nécessaire

      Ouvrir la science ne signifie pas ouvrir toutes ses données. En effet, open as possible, closed as necessary est un principe issu des recommandations de la Commission européenne (dès 2012) qui se traduit de la manière suivante "aussi ouvert que possible, pas plus fermé que nécessaire".

      Les données produites dans les organismes de recherche publics sont communicables à tous et toutes si elles n'entrent pas dans le cadre des exceptions légales (sécurité défense, sécurité des populations, patrimoine scientifique et technique, données personnelles, données liées au secret, statistique, etc.), et si elles constituent des documents dits achevés.

      Le scientifique doit choisir le degré et les modalités d’ouverture/fermeture de ses données. Il est nécessaire de prendre en compte l'aspect juridique des données sensibles, des données personnelles et notamment le règlement général sur la protection des données (le RGPD), ainsi que la protection des possibilités de valorisation économique.  Si l’ouverture de l’accès aux données constitue une valeur fondamentale de la recherche scientifique, elle peut comporter des risques de différentes natures : éthiques ou déontologiques (y incluant les données à caractère personnel), démocratiques, juridiques, financiers, économiques, réputationnels, concurrentiels...
    • Bon à savoir...

      Dans le cadre de partenariats ou de collaborations, il est important de préciser que :

      • il existe des conventions cadre avec des fournisseurs de données (IGN, Météo France, …) ;
      • il est important d’établir des conventions de recherche intégrant un paragraphe relatif à la protection intellectuelle sur les productions (dont les données, bases de données, logiciels) réalisées dans le cadre des travaux conduit ensemble, surtout si le partenaire est privé.

      Le scientifique, pilote du projet, doit connaître les contrats qui le lient à ses partenaires. Pour l’établissement de nouveaux contrats, il peut se faire conseiller par son chargé.e de partenariat innovation (CPI).
    • Pour définir le degré d'ouverture de mes données...

      INRAE met à votre disposition des outils pour vous aider à définir le degré d'ouverture de vos données.

      Conçu pour vous guider dans votre réflexion, ce logigramme détaille pas à pas les questions à se poser pour définir le degré et les modalités d'ouverture/fermeture de vos données.
      Vous pouvez également solliciter le réseau des RDO (Référents Données Opérationnels).



    • Le Cirad a également créé un outil d'aide à la décision sur la diffusion des données de recherche.

      L’arbre de décision proposé vise à guider les scientifiques dans le processus de diffusion des données de recherche. Il permet d’identifier les points de vigilance et, le cas échéant, les actions à mettre en œuvre avant la diffusion des données concernées.

      Passez en revue vos données en répondant aux questions successives de l’arbre de situation du Cirad.

    • Gouvernance des données à INRAE

      Parce que l'ouverture des données comporte des risques, INRAE s'est doté d'une politique de gouvernance des données. Quatre principes, détaillés dans une note téléchargeable ci-dessous, fondent les bases de cette politique et régissent les décisions à prendre lors du cycle de vie des données, c'est à dire à toutes les étapes de gestion, conservation, diffusion et réutilisation des données scientifiques liées aux activités de recherche.

      Ces principes, que vous pouvez retrouver sur le portail Science Ouverte INRAE DipSO, forment les axes d’un système de décision cohérent en étudiant une à une les dimensions scientifique (valeurs déontologiques et éthiques), technique (gestion des données mettant en avant les bonnes pratiques à respecter), réglementaire (respect de la législation et des engagements contractuels), et d’innovation (valeur produite pour la société).  C’est à l’issue d’un examen approfondi selon ces principes que le degré d’ouverture pourra être décidé.

      • Principe 1 : Il faut partager et réutiliser les données en respectant les valeurs de la science.
      • Principe 2 : Les données doivent être gérées en vue de les rendre F.A.I.R (Findable, Acceptable, Interoperable, Reuse). Ce principe est détaillé dans la partie "C'est quoi les principes FAIR ?".
      • Principe 3 : Les données doivent être « aussi ouvertes que possible, aussi fermées que nécessaire ».
      • Principe 4 : L’ouverture des données contribue à l’innovation et à la création de valeurs pour la société.

    • En complément, un schéma des "Rôles et responsabilités" téléchargeable présente les différents niveaux de responsabilité des acteurs INRAE en fonction des cas simples ou complexes à risque juridique plus ou moins fort.
      En effet, « gouverner » les données signifie que des (bonnes) décisions sont prises à chaque étape de leur cycle de vie (de leur production ou réutilisation à leur valorisation) et que les responsabilités de chacun sont définies dans un processus décisionnel.

      Les pages 6 et 7 des Principes pour la gouvernance des données, des codes et des algorithmes vous aideront à comprendre le schéma des "Rôles et responsabilités" ci-dessous.
    • Cette réflexion autour de l'ouverture des données pourra se dérouler lors de la rédaction d’un plan de gestion de données au moment du montage du projet de recherche. Vous pourrez approfondir ce point dans la rubrique "Pourquoi et comment faire un plan de gestion de données".

      Pour être accompagner, vous pouvez vous appuyer sur les référents données opérationnels (RDO) nommés à l’échelle d’une unité ou d’un collectif de recherche ou à défaut, les animateurs du réseau des référents données opérationnels (DipSO et RDS).


      Les référents données stratégiques (RDS) définissent les éléments de stratégies des départements :

      • Traitement des données sensibles (données à caractère personnel, données géolocalisées, données de santé, ….)
      • Données volumineuses (choix de l’entrepôt, modalités et durées de conservation - politique d’archivage, …)
      • Données propriété d’un tiers
      • Embargos (avant publication, valorisation de données de longue traine, etc…)
      • Etc.


      La gestion des données est un enjeu fort au sein des institutions de recherche et d’enseignement supérieur en France. Elle s’organise progressivement (Cf. Ateliers de la donnée dans les universités). Tous doivent nommer progressivement un administrateur des données, algorithmes et codes (ADAC) et des politiques de science ouverte se développent assorties de dispositifs d’accompagnement, notamment pour l’établissement des plans de gestion de données (PGD). Certains comme INRAE ont mis en place des réseaux métier dédiés (RDS et RDO) mais ce n’est pas encore le cas partout. Il n’y a pas d’obligation, chaque institution met en place l’organisation qu’elle juge la plus appropriée.

      Vous trouverez les informations complémentaires dans la rubrique "Les acteurs INRAE".

    • Les aspects juridiques et éthiques

      Les aspects juridiques et éthiques accompagnent tout le cycle de vie des données. Dès le début du projet, il faut s'y intéresser et se poser les bonnes questions. 
      Parcourez dans cette ressource interactive les aspects juridiques et éthiques concernant l'ouverture des données et/ou téléchargez la fiche synthétique.

    • Vous pouvez également consulter le Guide d'application de la loi pour une République numérique pour les données de la recherche (LRN). Ce guide, issu d’un travail commun du collège des données de la recherche et du groupe d’expertise juridique du Comité Science Ouverte (CoSO), vise à proposer des recommandations pour l'application de la LRN.

    • En résumé :

      Ouvrir ou non dépend :

      • de la stratégie scientifique ;
      • de la nature des données ;
      • du statut des données.


      Le mode par défaut est l’ouverture, mais on doit s’assurer au préalable que les données ne sont sont pas protégées (données sensibles, co-propriété, etc…). Si elle peuvent être ouvertes, s’assurer d’ouvrir au bon moment, au bon endroit, sous le bon format, avec la bonne licence, … et prendre soin d’avoir au préalable obtenu une validation scientifique par les pairs (publication dans un data paper, publication dans une revue classique, …).
      En tout état de cause, la réflexion doit être conduite et tranchée par le scientifique pilote du projet assisté du référent données stratégique (RDS) si besoin. Le référent données opérationnel (RDO) accompagne la mise en œuvre opérationnelle du mode de gestion approprié, consécutif de la décision qui ne lui incombe pas.

    • _____________________________________________


      Pensez à prendre en compte les problématiques de données personnelles et de cybersécurité !

      Pour compléter vos connaissances sur l'ouverture des données, vous pouvez consulter le portail Science Ouverte INRAE-DipSO


    • Sources :