Résumé de section

  • Qu'est-ce qu'une cohorte et quelles sont les particularités de ces données ?

    • Les cohortes en santé

      En épidémiologie, une cohorte est un groupe de personnes qui partagent une (ou plusieurs) caractéristique(s) commune(s) et qui sont suivies dans le temps pour étudier l'incidence de certaines maladies, l'effet de facteurs de risque ou l'efficacité d'interventions médicales. 

      Il est important d'avoir une large population pour être suffisamment générique ou statistiquement pertinent, bien qu'il soit difficile pour certaines pathologies de regrouper un nombre important de patients (maladies rares notamment).



    • Les données de cohortes

      Les données de cohortes peuvent concerner une large gamme de type de données : données démographiques, données cliniques, données comportementales, données génétiques, données d'imagerie médicale...

      Ces données sont majoritairement longitudinales et volumineuses, ce qui demande de prendre en considération certains points particuliers.

      Données longitudinales

      Les données sont recueillies à plusieurs moments dans le temps sur le même groupe d'individus.

      On peut rencontrer certaines difficultés au niveau du suivi des participants tout au long de l'étude, subir des biais ou perte de données à cause d'événements de vie (décès par exemple).

      Données volumineuses

      Les données sont générées à plusieurs reprises à partir de nombreux patients. Pour exemple, une cohorte d'images de 800 patients ayant souffert de la Covid a généré 5 To de données brutes (20 To de données après analyse).

      Ceci pose des enjeux cruciaux de maintenance dans le temps de ces données.


    • Enjeux de l'ouverture des données de cohortes en santé

      L'ouverture des données consiste en la mise à disposition des données brutes et des informations associées provenant d'études de cohortes à la communauté scientifique. Cette pratique vise à favoriser la transparence, la collaboration et l'avancement de la recherche en santé.

      Exemple de données de cohorte ouvertes : l'OFSEP

      L'OFSEP (Observatoire Français de la Sclérose en Plaques) est une cohorte nationale française regroupant des patients atteints de sclérose en plaques. Elle a été créée dans le but de collecter des données longitudinales sur la maladie, de suivre l'évolution des patients et d'étudier les facteurs liés à la sclérose en plaques.

      Logo de l'OFSEP

      L'OFSEP rassemble les données biologiques des patients (sang, urine, liquide cérébro-spinal) ainsi que des IRM. Les chercheurs ont la possibilité de solliciter l'accès aux données et aux échantillons collectés par l'OFSEP en soumettant un projet de recherche. Les demandes de projet sont évaluées conformément au processus de soumission établi.

      L'OFSEP a contribué à améliorer les connaissances sur la sclérose en plaques et à influencer les pratiques cliniques et la prise en charge des patients. Les données recueillies dans cette cohorte sont précieuses pour les chercheurs et les professionnels de la santé dans le domaine de la sclérose en plaques.

    • France Cohortes : une initiative française visant à fédérer et à promouvoir les cohortes françaises en santé

      Créée en 2011, l'initiative France Cohortes vise à promouvoir l'utilisation des données de cohortes en santé, à encourager la recherche inter-cohortes et à renforcer les collaborations entre les chercheurs et les cohortes. Elle vise également à améliorer la visibilité et l'accessibilité des cohortes françaises, notamment en facilitant l'accès aux données pour la communauté scientifique et en promouvant la transparence et la rigueur scientifique.

      Logo de France Cohortes.

    • Considérations techniques, juridiques et éthiques dans l'ouverture des données de cohortes en santé

      L'ouverture des données de cohortes implique deux enjeux principaux:

      • Enjeux techniques : les données doivent être ré-exploitables, ce qui nécessite l'utilisation de formats interopérables, une bonne description des données, un environnement informatique adapté... ;
      • Enjeux juridiques et éthiques : les données médicales nécessitent un traitement particulier pour éviter toute divulgation d'informations confidentielles associées aux patients.

      Dans ce cours, nous allons tenter de vous initier à l'ouverture de données de cohortes en tenant compte de ces enjeux. Nous allons nous concentrer sur l'utilisation de données d'imagerie médicale

      Pour commencer, il semble incontournable d'aborder un format standard largement utilisé dans les domaines de l'imagerie médicale (radiologie, tomodensitométrie, IRM, échographie...) : le format DICOM.