Thèse soutenue

Études d'association génome entier guidées par des réseaux

FR  |  
EN
Auteur / Autrice : Héctor Climente González
Direction : Véronique StovenChloé-Agathe Azencott
Type : Thèse de doctorat
Discipline(s) : Bio-informatique
Date : Soutenance le 04/02/2020
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : Ecole doctorale Ingénierie des Systèmes, Matériaux, Mécanique, Énergétique (Paris)
Partenaire(s) de recherche : Laboratoire : Centre de bio-informatique (Fontainebleau, Seine et Marne)
établissement de préparation de la thèse : École nationale supérieure des mines (Paris ; 1783-....)
Jury : Président / Présidente : Nadine Andrieu
Examinateurs / Examinatrices : Véronique Stoven, Chloé-Agathe Azencott, Laura Furlong
Rapporteurs / Rapporteuses : Kristel Van Steen, Antonio Rausell

Résumé

FR  |  
EN

Cette thèse s'intéresse à un ensemble de méthodes utilisées pour identifier les causes génétiques de maladies complexes. Les méthodes d'association génome entier (GWAS), sont généralement utilisées pour étudier des associations univariées, tandis que les méthodes d'association d'interactions génome entier (GWAIS) prennent en considération des interactions entre facteurs génétiques (ou épistasie). Cependant, ces deux approches présentent plusieurs défis, parmi lesquels leur faible puissance statistique, la difficulté de leur interprétation, ainsi que les choix arbitraires qui doivent être faits à différentes étapes de ces études. Dans cette thèse, j'étudie comment l'utilisation de réseaux biologiques permet de répondre à ces défis et faciliter la découverte de nouveaux biomarqueurs. Les réseaux biologiques permettent en effet d'incorporer des connaissances a priori aux analyses statistiques, et de considérer chaque polymorphisme d'un seul nucléotide (SNP) et chaque gène dans leur contexte biologique. En analysant deux jeux de données, un sur le cancer du sein et l'autre sur les maladies chroniques inflammatoires de l'intestin, je montre comment l'utilisation de réseaux biologiques permet de mettre à jour de nouveaux mécanismes de susceptibilité. Ceux-ci impliquent des SNPs individuels, ainsi que des groupes de SNPs en épistasie d'ordre deux ou plus. Je montre aussi comment l'incorporation de réseaux biologique dans les GWAS et GWAIS permet d'améliorer l'interprétabilité des résultats et de produire des hypothèses biologiques convaincantes.