Thèse de doctorat en Mathématiques appliquées. Statistiques
Sous la direction de Jean-Marc Azaïs et de Brigitte Mangin.
Soutenue en 2006
à Toulouse 3 .
Les méthodes de cartographie génétique sont des méthodes statistiques qui permettent, pour un caractère donné, d'identifier les zones du génome qui sont impliquées dans l'expression de ce caractère. Le but de ma thèse est de développer de telles méthodes et d'analyser leurs performances dans le cas de caractères qui prennent des valeurs continues. Les méthodes que je propose sont basées sur la notion de déséquilibre de liaison, c'est à dire sur l'étude des corrélations entre les phénotypes et les génotypes d' individus observés issus d'une même population. La première partie de mes travaux concerne le développement d'un algorithme numérique permettant de calculer de manière approchée la densité de transition des fréquences d'haplotypes sous un modèle de diffusion à deux loci bialléliques avec recombinaison. C'est un problème classique de génétique des populations, dont la solution exacte n'est pas connue. Je montre également que cette méthode numérique peut être utilisée pour calculer la vraisemblance de la position d'un gène, et la compare à d'autres approches classiques. Dans une deuxième partie, je présente une méthode de cartographie de QTL par maximum de vraisemblance. Le calcul de la vraisemblance est basé sur une approximation d'ordre 1 et sur l'espérance des fréquences d'haplotypes sous un modèle de Wright-Fisher à 3 loci avec recombinaison, dont je dérive une expression approchée. Des résultats de simulation montrent le bon comportement de cette méthode par rapport aux méthodes existantes. Enfin, dans la troisième partie, je m'intéresse au problème de la détection de QTL dans le cas de populations structurées. On sait que cette structure est un désavantage pour la détection de QTL, et des tests spéciaux ont été développés dans ce contexte. Je m'intéresse plus particulièrement aux propriétés de l'un d'entre eux, le Transmission Desequilibrium Test (TDT). J'étudie la loi asymptotique de ce test dans un modèle de population structurée et en déduis des résultats concernant son erreur de première espèce et sa puissance.
Linkage disequilibrium mapping of quantitative trait loci
Mapping methods are statistical methods used to estimate the position of the genes which influence the expression of a given trait of interest. The aim of my work is to design such methods and to evaluate their efficiency in the case where the trait takes continuous values. The methods I propose are based on the notion of linkage disequilibrium, i. E. The study of the correlations between the phenotypes and genotypes of independent individuals sampled from the same population. My first contribution to this subject is the development of a numerical algorithm to compute an approximation of the transition density of haplotype frequencies for two biallelic loci with recombination under a diffusion model. This is a well-known problem of population genetics, for which an exact solution has not yet been found. I also show that my numerical method can be used for estimating the likelihood of a gene position, and compare this approach with other standard approaches. The second part of my work is devoted to a likelihood maximization method for mapping quantitative trait loci (QTL). The likelihood of the QTL position is computed using a first-order approximation based on the expected haplotype frequencies under a three-locus Wright-Fisher model with recombination. I derive an approximation of these expected frequencies. Simulation results show that this method compares favorably to other existing mapping methods…
Cette thèse a donné lieu à une publication en 2007 par [CCSD] à Villeurbanne
Cartographie de gènes à caractères quantitatifs par déséquilibre de liaison