Statistiques bayésiennes en génétique des populations : modèle à facteurs et processus gaussiens pour étudier la variation génétique neutre et adaptative

par Nicolas Duforet-Frebourg

Thèse de doctorat en Modèles, méthodes et algorithmes en biologie, santé et environnement

Sous la direction de Michaël Blum.

Le président du jury était Denis Allard.

Le jury était composé de Julien Mairal.

Les rapporteurs étaient Renaud Vitalis, Christophe Ambroise.


  • Résumé

    Nous présentons dans cette thèse plusieurs travaux de statistiques bayésiennes appliquées à la génétique des populations. La génétique des populations a pour but d'expliquer les variations génétiques au sein d'une espèce, et d'inférer les processus ayant conduits à ces variations. Pour cela, des données génétiques massives sont utilisées et il y a un besoin grandissant de méthodes statistiques pour traiter ces données. Le travail de cette thèse s'inscrit dans cet effort de modélisation statistique pour répondre aux enjeux de la génétique des populations, et de la biologie de l'évolution. Nous nous intéressons tout particulièrement à la détection de traces d'adaptation locale dans les génomes, et à l'inférence des variations spatiales non stationnaires.Un modèle d'analyse factorielle bayésien est proposé pour détecter les traces d'adaptation locale. Nous comparons notre approche aux méthodes existantes, et démontrons qu'elle permet d'obtenir un plus faible taux de fausses découvertes. Nous présentons également un modèle bayésien basé sur des processus gaussiens pour caractériser les variations génétiques spatiales dans l'aire de répartition d'une espèce. Les performances de ces méthodes sont démontrées sur différents exemples issus de simulations ou de données. Plusieurs logiciels open source qui implémentent ces méthodes ont été développés pendant la thèse.

  • Titre traduit

    Bayesian statistics in population genetics : factor model and gaussian processes to study neutral and adaptive genetic variation


  • Résumé

    In this thesis we present several works related to Bayesian statistics in population genetics. Population genetics aims at explaining genetic variation within natural species, and infer the different processes that lead to current genetic variation. Large scale genomic datasets are produced, and there is an increasing need of statistical methods to extract information from these datasets. My thesis work is part of this statistical modeling effort to answer to evolutionary biology and population genetic questions. We are interested in detecting footprints of local adaptation without, and infering non-stationary patterns of spatial variation. A Bayesian factor model is used to detect genes involved in local adaptation. We compare our factor model to existing methods, and show that it can reduce the false discovery rate. We also present a Bayesian model based on Gaussian processes to caracterize spatial genetic variations within species. The performances of these methods are tested on simulations and real datasets. Several open source software are available online.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Service Interétablissement de Documentation. LLSH Collections numériques.
  • Bibliothèque : Université Savoie Mont Blanc (Chambéry-Annecy). Service commun de la documentation et des bibliothèques universitaires. Bibliothèque électronique.
  • Bibliothèque : Service interétablissements de Documentation. STM. Collections numériques.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.