Sparse precision matrix estimation in high dimension and application to medical imaging : hypothesis testing on some particular graphical models of GLASSO

par Thi Khuyen Le

Thèse de doctorat en Mathématiques. Statistiques

Sous la direction de Frédéric Richard et de Caroline Chaux.

Le président du jury était Sophie Achard.

Le jury était composé de Eric Guedj, Pierre Pudlo.

Les rapporteurs étaient Jérémie Bigot, Florence Forbes.


  • Résumé

    Notre recherche exploite deux caractéristiques principales du modèle GLASSO: la parcimonie et la monotonie. En se basant sur la parcimonie de ce modèle, nous proposons d'adapter la méthode d'analyse discriminante linéaire (ADL) en grande dimension, en incorporant une estimation parcimonieuse de la matrice de précision sur l'ensemble de la population. Afin d'améliorer la performance de cette méthode, nous proposons de réduire la dimension de données en sélectionnant des composantes connexes plus discriminantes. Cette sélection est basée sur une forme spéciale de la matrice de précision qui est diagonale par blocs. En particulier, chaque bloc est correspondant à une composante connexe dans le modèle GLASSO. En se basant sur la méthode d'analyse discriminante factorielle, nous définissons la capacité discriminante de chaque composante. Ensuite, la sélection est restreinte uniquement sur les variables dans les composantes dont les capacités discriminantes sont plus grandes. Tous ces méthodes sont appliquées sur les données réelles issues de l'imagerie cérébrale tomographie pour la classification de certains groupes de patients atteints comme fibromyalgie, dépression, ou de la maladie d'Alzheimer. Par ailleurs, en se basant sur la monotonie du modèle GLASSO, nous proposons un test de la signification des composantes sur des modèles d'intersection et d'union de GLASSO. Ces tests nous permettent de déterminer le modèle le plus parcimonieux qui contient toutes les composantes connexes du vrai modèle. En particulier, ces tests convergent sur des lois exponentielles avec des nombres raisonnables de variables et d’observations


  • Résumé

    Our research exploits two main characteristics of the GLASSO model: the sparsity and the monotony. Based on the sparsity of this model, we propose to adapt the linear discriminant analysis method (LDA) in high dimension by using a sparse estimated precision matrix on the whole population. In order to improve the performance of this method, we propose to reduce the dimension of data by selecting the most discriminant connected components. This method is based on a block diagonal form of the precision matrix. In fact, each block is corresponding to a component of the GLASSO model. Inspired from the factorial discriminant analysis method, we define the discriminant capacity for each component. Then the selection is restricted only on the variables within the components whose discriminant capacities are the largest. Our Adapted-LDA and connected component selection methods are applied to real data from PET tomography brain imaging for classifying certain patient groupes such as fibromyalgia, depression, or Alzheimer's disease. In addition, based on the monotony of the GLASSO model, we propose to formulate a significance test for the connected components on the intersection as well as the union of GLASSO models. These tests allow us to determine the sparsest estimated model which contains all the components of the real model. They converge to exponential distribution with reasonable numbers of observations and variables


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université d'Aix-Marseille. Service commun de la documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.