Développement de méthodes statistiques pour l'identification de gènes d'intérêt en présence d'apparentement et de dominance, application à la génétique du maïs

par Fabien Laporte

Projet de thèse en Mathématiques appliquées

Sous la direction de Tristan Mary-huard.

Thèses en préparation à Paris Saclay , dans le cadre de Mathématiques Hadamard , en partenariat avec MIA - Mathématiques et Informatique Appliquées (laboratoire) et de université Paris-Sud (établissement de préparation de la thèse) depuis le 01-10-2014 .


  • Résumé

    La génétique d'association consiste à identifier les gènes impactant la variabilité du phénotype des individus. Pour cela, on modélise les phénotypes mesurés sur les individus par un modèle mixte, où l'effet fixe représente l'effet des différents allèles d'un gène candidat et où l'effet aléatoire quantifie le "fond génétique", i.e. les effets génétiques dûs au reste du génome. L'objectif du doctorat est d'ajouter à ce modèle un effet aléatoire supplémentaire pour tenir compte des effets de dominance dans le fond génétique. Ceci suppose tout d'abord d'inférer la matrice de covariance de ce nouvel effet à partir de l'apparentement entre individus et de leur consanguinité. Dans un deuxième temps, il sera nécéssaire de développer des méthodes efficaces d'inférence pour le modèle mixte considéré, qui devra être appliqué à chaque gène candidat (plusieurs millions de candidats). Ces approches devraient permettre d'identifier de nouveaux gènes d'une part, et d'obtenir une meilleure prédiction des valeurs phénotypiques des individus lorsque les effets de dominance sont importants.

  • Titre traduit

    Development of statistical methods for the identification of interesting genes with relatedness and dominance, application to the maize genetic


  • Résumé

    The genome-wide association aims at detecting genes affecting phenotypic variability of individuals. For this purpose, we modelise phenotype mesured on individuals by a mixed model, where the fixed effect is the effect of different alleles of a candidate gene and where the random effect is the "genetic background", i.e. the genetic effects due to the rest of the genome. The objective of the PhD is to add to this model an additional random effect to reflect the dominance effects in the genetic background. This requires first to infer the covariance matrix of this new effect from the relatedness between individuals and their inbreeding. Secondly , it will be necessary to develop efficient inference methods for the considered mixed model which has to be applied to each candidate gene (several million candidates). These approaches should identify new genes on the one hand , and to obtain a better prediction of phenotypic values ​​when individuals dominance effects are significant.