Thèse soutenue

Méthodes statistiques pour la stratification de patients dans le contexte de l'obésité : application aux données du microbiote intestinal et cytométrie en flux

FR  |  
EN
Auteur / Autrice : Elie-Julien El Hachem
Direction : Hédi SoulaNataliya Sokolovska
Type : Thèse de doctorat
Discipline(s) : Bioinformatique et biologie des systèmes
Date : Soutenance le 22/09/2023
Etablissement(s) : Sorbonne université
Ecole(s) doctorale(s) : École doctorale Physiologie, Physiopathologie et Thérapeutique (Paris ; 2000-....)
Partenaire(s) de recherche : Laboratoire : Nutrition et obésités (approches systémiques) (Paris)
Jury : Président / Présidente : Ingrid Lafontaine
Examinateurs / Examinatrices : Laura Cantini
Rapporteurs / Rapporteuses : Sophie Donnet, Fariza Tahi

Résumé

FR  |  
EN

La prévalence de l'obésité et du diabète de type II a fortement augmenté ces dernières années, faisant de la recherche dans ces domaines une priorité de santé publique. Parallèlement à cela, le développement des technologies à haut débit ont permis d’obtenir un grand nombre de données hétérogènes provenant des patients et de leur microbiote intestinal. Ces données de grandes dimensions ont une structure qui est propre à chacun d'eux. Ainsi dans le but d’identifier différents schémas entre les patients et pouvoir les stratifier (c’est-à-dire les classifier en différents sous-groupes homogènes en fonction de leurs caractéristiques biologiques), il est nécessaire de développer de nouvelles méthodes computationnelles. Cette thèse présente le concept de « Double Clustering », qui implique la tâche de regrouper simultanément les types de cellules et les patients. Pour cela, nous proposons une nouvelle approche algorithmique appelée LDA-DC (Latent Dirichlet Allocation for Double Clustering) dont le but est d’identifier les groupes de cellules associés aux phénotypes des patients, facilitant ainsi une stratification efficace de ceux-ci. Nous démontrons l'efficacité de notre méthodologie en utilisant des données de patients disponibles publiquement. De plus, nous appliquons notre approche aux données métagénomiques des patients du laboratoire NutriOmics et stratifions les patients sous forme de réseau révélant des groupes de patients ayant des caractéristiques cliniques, biologiques et nutritionnelles communes. D’autre part, nous avons développé une méthodologie basée sur un réseau de neurones artificiel dans le but de prédire l’âge métabolique des patients atteints d’obésité et/ou de diabète de type II en comparaison des patients non-obèses, permettant une stratification des patients. Ainsi, cette thèse s'aligne avec les principes de la médecine de précision et de la médecine prédictive en proposant une approche computationnelle permettant la stratification des patients et l'identification de variables pouvant être modulées dans le cadre d'une stratégie de médecine préventive.