Use of large-scale cow genotyping to dissect dairy complex traits beyond additive effects Utilisation du génotypage des vaches à grande échelle pour disséquer le déterminisme génétique des caractères complexes au-delà des effets additifs

par Andrew Marete

Thèse de doctorat en Génétique animale

Sous la direction de Didier Boichard et de Mogens Sando Lund.

Thèses en préparation à Paris, Institut agronomique, vétérinaire et forestier de France en cotutelle avec l'AARHUS UNIVERSITY , dans le cadre de École doctorale Agriculture, Alimentation, Biologie, Environnement, Santé (Paris ; 2015-....) , en partenariat avec GABI - Génétique animale et Biologie intégrative UMR1313 (laboratoire) .


  • Résumé

    La sélection génomique (SG) révolutionne actuellement l'élevage bovin laitier. Cependant, la SG est efficace dans les populations avec de grandes populations de référence de taureaux génotypés et testés pour former les modèles de prédiction génomique, mais elle est moins efficace dans les populations plus petites. Deux approches principales sont actuellement à l'étude pour améliorer la précision des prédictions dans les races numériquement petites. La première est de développer des prédictions multi-raciales. Comme le déséquilibre de liaison (DL) entre races éloignées n'est pas assez fort pour utiliser simplement de l'information sur le génotype à grande échelle de la puce 50K, cette approche est fortement liée à l'utilisation de génotypes à haute densité et de l'information sur la séquence du génome entier (WGS). La deuxième approche consiste à génotyper un grand nombre de vaches avec phénotypes afin d'élargir la population de référence. Dans les chapitres 2.1 et 2.2, nous avons tiré parti des deux approches en utilisant l'information génotypique sur de nombreuses vaches de cinq races. Ces vaches ont été génotypées avec des puces personnalisées comprenant un nombre croissant de mutations causales confirmées ou candidates (QTN potentiel), découvertes dans le cadre d'études d'association à grande échelle du génome (GWAS) combinant le génotypage et le séquençage du génome entier (WGS). Le génotypage à grande échelle de QTN potentiels dans plusieurs races a fourni une approche puissante pour prioriser entre ces variants et identifier les marqueurs qui expliquent la variance génétique entre les races et peuvent donc être utilisés pour améliorer les prédictions. Dans le chapitre 2.3, nous avons identifié plusieurs nouveaux QTL qui peuvent être utilisées pour sélectionner la vitesse de traite sans détériorer les caractères de santé de la mamelle tels que la susceptibilité aux mammites cliniques et le score de cellules somatiques dans le lait. Contrairement aux écarts de performances des groupes de filles, qui reflètent principalement la valeur additive des taureaux, la performance d'une vache est le résultat d'effets additifs et non additifs. Dans le chapitre 2.4, nous avons étudié les effets additifs avec l'approche « Association Weighted Matrix » (AWM) en combinaison avec la méthode PCIT (« Partial Correlation Coefficient with Information Theory”), un algorithme d'inférence de réseau, pour générer des réseaux de gènes ayant une signification régulationnelle et fonctionnelle pour les phénotypes liés à la mamelle. En exploitant des phénotypes corrélés, nous avons augmenté la précision de l'inférence statistique et identifié dix gènes qui affectent directement le développement de la glande mammaire. Dans le chapitre 2.5, avec une approche bayésienne, nous avons estimé les composantes de dominance et d'épistasie, dans ce dernier cas pour un jeu de variants identifiés comme ayant un effet additif significatif. La variance de dominance était assez stable entre races et entre caractères, de l'ordre de 20 % de la variance génétique additive. Les estimations de variance épistatique étaient plus variables, de presque zéro à 19% de la variance génétique additive, avec une moyenne de 7%. Il s'agit d'une recherche originale sur l'utilisation de données de séquence pour étudier l'épistasie chez les bovins laitiers.

  • Titre traduit

    Use of large-scale cow genotyping to dissect dairy complex traits beyond additive effects


  • Résumé

    Genomic selection (GS) is presently revolutionizing dairy cattle breeding. GS, however, is efficient in populations with large reference populations of genotyped and progeny tested bulls to train the genomic prediction models, but less efficient in smaller populations. Two main approaches are currently being tested to improve prediction accuracies in numerically small breeds. The first is to develop across breed predictions. Because the linkage disequilibrium (LD) across distantly related breeds is not strong enough to simply use large scale 50K genotype information, this approach is strongly linked to use of high density genotypes and whole genome sequence (WGS) information. The second approach is to genotype vast number of cows with phenotypes to enlarge the reference population. In chapter 2.1 and 2.2, we took advantage of both approaches by using genotype information on many cows in five breeds. These cows were genotyped with customized chips including an increasing number of confirmed or candidate causative mutations (potential QTN), discovered in large scale genome-wide association studies (GWAS) combining genotyping and whole genome sequencing (WGS). The large-scale genotyping of potential QTN across multiple breeds provided a powerful approach to prioritize between potential QTN, thus providing evidence on which markers explain genetic variance across breeds and therefore can be used to improve predictions. In chapter 2.3, we identified several novel QTL that be used to select for reduced milking time without causing deterioration in important health traits such as clinical mastitis and somatic cell score. In contrast with Daughter Yield Deviations, which primarily reflect the additive value of the bulls, a cow's performance is the result of additive and non-additive effects. In chapter 2.4 we studied additive effects using the Associated Weight Matrix (AWM), in combination with Partial Correlation Coefficient with Information Theory (PCIT), a network inference algorithm, to generate gene networks with regulatory and functional significance for udder related phenotypes. By exploiting correlated udder phenotypes, we increased the accuracy of statistical inference and identified ten genes that directly affect mammary gland development. In chapter 2.5, we pre-selected SNP with major effect and using a Bayesian approach, estimated dominance and epistasis as explained by second-order gene interactions. Dominance variance was consistent across breeds and traits and represented about 20% of the additive genetic variance. The epistatic variance estimates were more variable, from nearly zero to 19% of the additive genetic variance, with an average of 7%. This provides original research on use of sequence data to study epistasis in dairy cattle.