Thèse soutenue

Optimisation des méthodes statistiques d'analyse de la variabilité des caractères à l'aide d'informations génomiques

FR  |  
EN
Auteur / Autrice : Laval Jacquin
Direction : Jean-Michel ElsenHélène Gilbert
Type : Thèse de doctorat
Discipline(s) : Modélisation-Mathématiques appliquées
Date : Soutenance le 10/10/2014
Etablissement(s) : Toulouse, INPT
Ecole(s) doctorale(s) : École doctorale Sciences écologiques, vétérinaires, agronomiques et bioingénieries (Toulouse)
Partenaire(s) de recherche : Laboratoire : Génétique Physiologie et Systèmes d'Élevage (Castanet-Tolosan, Haute-Garonne ; 2014-....)
Jury : Examinateurs / Examinatrices : Jean-Michel Elsen, Hélène Gilbert
Rapporteurs / Rapporteuses : Didier Boichard, Miguel Pérez-Enciso

Résumé

FR  |  
EN

L’avènement du génotypage à haut débit permet aujourd’hui de mieux exploiter le phénomène d’association, appelé déséquilibre de liaison (LD), qui existe entre les allèles de différents loci sur le génome. Dans ce contexte, l’utilité de certains modèles utilisés en cartographie de locus à effets quantitatifs (QTL) est remise en question. Les objectifs de ce travail étaient de discriminer entre des modèles utilisés en routine en cartographie et d’apporter des éclaircissements sur la meilleure façon d’exploiter le LD, par l’utilisation d’haplotypes, afin d’optimiser les modèles basés sur ce concept. On montre que les modèles uni-marqueur de liaison, développés en génétique il y a vingtaine d’années, comportent peu d’intérêts aujourd’hui avec le génotypage à haut débit. Dans ce contexte, on montre que les modèles uni-marqueur d’association comportent plus d’avantages que les modèles uni-marqueur de liaison, surtout pour des QTL ayant un effet petit ou modéré sur le phénotype, à condition de bien maîtriser la structure génétique entre individus. Les puissances et les robustesses statistiques de ces modèles ont été étudiées, à la fois sur le plan théorique et par simulations, afin de valider les résultats obtenus pour la comparaison de l’association avec la liaison. Toutefois, les modèles uni-marqueur ne sont pas aussi efficaces que les modèles utilisant des haplotypes dans la prise en compte du LD pour une cartographie fine de QTL. Des propriétés mathématiques reliées à la cartographie de QTL par l’exploitation du LD multiallélique capté par les modèles haplotypiques ont été explicitées et étudiées à l’aide d’une distance matricielle définie entre deux positions sur le génome. Cette distance a été exprimée algébriquement comme une fonction des coefficients du LD multiallélique. Les propriétés mathématiques liées à cette fonction montrent qu’il est difficile de bien exploiter le LD multiallélique, pour un génotypage à haut débit, si l’on ne tient pas compte uniquement de la similarité totale entre des haplotypes. Des études sur données réelles et simulées ont illustré ces propriétés et montrent une corrélation supérieure à 0.9 entre une statistique basée sur la distance matricielle et des résultats de cartographie. Cette forte corrélation a donné lieu à la proposition d’une méthode, basée sur la distance matricielle, qui aide à discriminer entre les modèles utilisés en cartographie.