Modélisation de données cliniques de grande dimension : application aux pathologies respiratoires

par Grégory Marin

Thèse de doctorat en Biostatistique

Sous la direction de Nicolas Molinari et de Arnaud Bourdin.


  • Résumé

    Cette thèse est consacrée à l'application et au développement de méthodes biostatistiques originales pour des applications médicales et cliniques concernant plus particulièrement les pathologies respiratoires. Il s'agit ainsi d'un travail de recherche transversale, visant à la modélisation de données hétérogènes, colinéaires et de grande dimension pour des applications cliniques. Un état de l'art traitant du diagnostic de l'asthme et de hyperactivité bronchique a tout d'abord été dressé, avant de proposer une première application statistique, prenant la forme de modèles de régressions multiples. Ce type de modèle étant particulièrement sensible à la dimension et la colinéarité des données, les chapitres suivants proposent plusieurs améliorations, après avoir explicité en détail l'enjeu et les méthodes actuelles d'analyse de données de grande dimension. Un premier modèle de classification hiérarchique non supervisé a été mis au point et appliqué au cas de la quantification du piégeage aérique. Un algorithme de régression Partial Least Square a également été mis en œuvre, prédisant une ou plusieurs variables Y à partir d'un set de variables X hétérogènes et colinéaires, ce qui a permis de mettre en évidence l'impact de l'âge sur les petites voies aériennes, tout en considérant de nombreux autres paramètres. Enfin, un algorithme d'analyse fractale a été créé, en vue de quantifier en une seule valeur la complexité spatiale et géométrique d'images de scanners thoraciques, cela constituant un innovant outil d'aide au diagnostic radiologique.

  • Titre traduit

    High-Dimensional Clinical Data Modeling : Application To Respiratory Diseases


  • Résumé

    This thesis outlines new statistic methods devoted to clinical and medical applications, dealing more precisely with respiratory diseases. Our goal was to model and analyze high-dimensional clinical data, often heterogeneous, and collinear. A clinical state of the art of asthma diagnosis and bronchial hyperreactivity was first stated, before proposing a first statistical application, which took the shape of multiple regression models. This type of models is particularly tricky when treating high-dimensional collinear data, which is why the other chapters are an enhancement of this first model. Firstly, a non-supervised hierarchical classification was carried out and applied to air trapping quantification. A Partial Least Square regression model was also executed, allowing prediction of one or more variables from a set of X variables, which allowed us to highlight the impact of age on small airway impairment. Finally, a fractal analysis was performed, in order to quantify the geometrical and spatial complexity of a CT scan image into a single value. This kind a prospective methodology, where the statistics are directly involved in the clinical work, represents a brand new tool which can help medical diagnosis.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Bibliothèque interuniversitaire. Section Sciences.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.