Méthodes statistiques pour la stratification de patients dans le contexte de l'obésité : application aux données du microbiote intestinal et cytométrie en flux
Auteur / Autrice : | Elie-Julien El Hachem |
Direction : | Hédi Soula, Nataliya Sokolovska |
Type : | Thèse de doctorat |
Discipline(s) : | Bioinformatique et biologie des systèmes |
Date : | Soutenance le 22/09/2023 |
Etablissement(s) : | Sorbonne université |
Ecole(s) doctorale(s) : | École doctorale Physiologie, Physiopathologie et Thérapeutique (Paris ; 2000-....) |
Partenaire(s) de recherche : | Laboratoire : Nutrition et obésités (approches systémiques) (Paris) |
Jury : | Président / Présidente : Ingrid Lafontaine |
Examinateurs / Examinatrices : Laura Cantini | |
Rapporteurs / Rapporteuses : Sophie Donnet, Fariza Tahi |
Mots clés
Résumé
La prévalence de l'obésité et du diabète de type II a fortement augmenté ces dernières années, faisant de la recherche dans ces domaines une priorité de santé publique. Parallèlement à cela, le développement des technologies à haut débit ont permis d’obtenir un grand nombre de données hétérogènes provenant des patients et de leur microbiote intestinal. Ces données de grandes dimensions ont une structure qui est propre à chacun d'eux. Ainsi dans le but d’identifier différents schémas entre les patients et pouvoir les stratifier (c’est-à-dire les classifier en différents sous-groupes homogènes en fonction de leurs caractéristiques biologiques), il est nécessaire de développer de nouvelles méthodes computationnelles. Cette thèse présente le concept de « Double Clustering », qui implique la tâche de regrouper simultanément les types de cellules et les patients. Pour cela, nous proposons une nouvelle approche algorithmique appelée LDA-DC (Latent Dirichlet Allocation for Double Clustering) dont le but est d’identifier les groupes de cellules associés aux phénotypes des patients, facilitant ainsi une stratification efficace de ceux-ci. Nous démontrons l'efficacité de notre méthodologie en utilisant des données de patients disponibles publiquement. De plus, nous appliquons notre approche aux données métagénomiques des patients du laboratoire NutriOmics et stratifions les patients sous forme de réseau révélant des groupes de patients ayant des caractéristiques cliniques, biologiques et nutritionnelles communes. D’autre part, nous avons développé une méthodologie basée sur un réseau de neurones artificiel dans le but de prédire l’âge métabolique des patients atteints d’obésité et/ou de diabète de type II en comparaison des patients non-obèses, permettant une stratification des patients. Ainsi, cette thèse s'aligne avec les principes de la médecine de précision et de la médecine prédictive en proposant une approche computationnelle permettant la stratification des patients et l'identification de variables pouvant être modulées dans le cadre d'une stratégie de médecine préventive.