Résumé de section

  • Vous avez publié votre étude et partagé les données sous-jacentes, avec en complément toutes les informations nécessaires pour comprendre et réutiliser les données.

    Toutefois, vous avez commis quelques erreurs en terme de gestion et de partage de données qui vous ont fait perdre du temps.

    En conclusion, voici des propositions d'amélioration si vous êtes amené à refaire l’étude.

    • Appliquer des bonnes pratiques de sauvegarde et de stockage des données

      Sauvegarder les données avec une fréquence régulière courte et sur des supports différents permet d’éviter les pertes définitives de données. Une règle intéressante à suivre est la sauvegarde 3-2-1 : 3 copies sur 2 supports différents dont 1 à distance.

      Callisto. (2022, 14 juin). La sauvegarde 3-2-1. [Vidéo]. Canal-U. https://www.canal-u.tv/117058. (Consultée le 15 mars 2023)


      Pensez aussi à choisir des solutions de stockage facilitant l'accès de vos données à vos collaborateurs. Cela vous évitera d'avoir à envoyer des courriels à chaque fois aux collaborateurs du projet. Ci-dessous un tableau comparatif des supports de stockage en termes de sécurité et de partage.

      Tableau comparatif support stockage


    • Appliquer une convention simple de nommage des variables

      Partir sur des abbréviations simples vous facilitera le travail de nettoyage de la base de données sur R et Excel : une meilleure transcription des données pour éviter la perte de temps pour recoder sur les logiciels de traitement.

      Il convient de rendre le nom des variables le plus court et le plus simple possible. Quelques règles de bonnes pratiques : 

      • ne pas mettre d’espace, 
      • privilégier le _ (tiret du 8), 
      • pas d’accent, de caractère spécial, ou de majuscule. 


      Le but est de simplifier au maximum tout en rendant lisible et réutilisable votre base de données principale. En parallèle, il convient de créer un dictionnaire des variables pour préciser les éléments du codage, ce qui est d'autant plus nécessaire lorsque ces derniers sont nombreux et complexes.


    • Vérifier les conditions possibles de partage dans le cadre de votre projet

      Il est nécessaire de prêter plus d’attention à la convention et aux conditions légales du projet. Dans cette étude de cas, il n'y avait pas de contraintes au partage des données. Toutefois, et de façon générale, plusieurs aspects sont à réfléchir en amont, comme les droits et obligations quant à la diffusion des données et le choix de licences adaptées, notamment aux bases de données.