Prédiction assistée par marqueurs de la performance hybride dans un schéma de sélection réciproque : simulations et évaluation expérimentale pour le maïs ensilage

par Adama Innocent Seye

Thèse de doctorat en Sciences agronomiques

Sous la direction de Laurence Moreau et de Alain Charcosset.


  • Résumé

    Le maïs (Zea mays L.) est la plante la plus cultivée au monde. Pour valoriser le fort effet d’hétérosis pour les caractères liés à la biomasse, la diversité génétique du maïs est structurée en groupes hétérotiques et les variétés cultivées sont majoritairement des hybrides F1 entre lignées de groupes complémentaires. La valeur hybride se décompose comme la somme de l’Aptitude Générale à la Combinaison (AGC) de chacune des lignées parentales et de l’Aptitude Spécifique à la Combinaison (ASC) du couple. En Europe du Nord, le maïs est souvent utilisé en ensilage destiné à l'alimentation animale. L’objectif de sélection est d’améliorer la productivité et d'assurer une bonne digestibilité du maïs ensilage. Les objectifs de cette thèse étaient : (i) d’estimer l’importance de l’AGC et de l’ASC dans la variance génétique hybride pour les caractères de qualité de l’ensilage, (ii) d’identifier les locus (QTL) impliqués dans ces caractères et d’étudier leur colocalisation avec des QTL de productivité, (iii) d’évaluer l’intérêt de la sélection génomique pour la prédiction des performances hybrides et (iv) de comparer l’efficacité de deux dispositifs de calibration des prédictions basés sur un factoriel ou l’utilisation classique de testeurs du groupe complémentaire. Dans le cadre du projet SAM-MCR, 6 familles biparentales connectées ont été créés dans les groupes « corné » et « denté » à partir de 4 lignées fondatrices. Dans une première phase, 822 lignées cornées et 802 dentées ont été génotypées pour 20k SNP et croisées selon un factoriel incomplet pour produire 951 hybrides, phénotypés pour des caractères de qualité et de productivité (étudiés par H. Giraud pendant sa thèse). L’analyse des caractères de qualité a montré une prédominance de l’AGC par rapport à l’ASC ainsi qu’une corrélation négative entre les caractères de qualité et le rendement. De nombreux QTLs multi-alléliques ont été détectés, la plupart spécifiques d’un groupe et dont certains colocalisent avec des QTL de rendement. Par validation croisée, la qualité de prédictions basées sur les QTL détectés s’est avérée plus faible que celle obtenue par prédiction génomique. La prise en compte de l’ASC n‘a pas permis d’améliorer sensiblement la qualité de prédictions des modèles. Dans une seconde phase, 90 lignées ont été choisies par groupe : 30 sélectionnées sur la base de leurs prédictions génomiques pour la productivité et la valeur énergétique et 60 choisies aléatoirement parmi les 6 familles. Ces lignées ont été croisées selon un factoriel incomplet pour produire 360 nouveaux hybrides : 120 issus des lignées sélectionnées et 240 issus des lignées choisies au hasard. Les 90 lignées de chaque groupe ont aussi été croisées à deux lignées fondatrices du groupe complémentaire (testeurs). Les hybrides issus des lignées sélectionnées se sont avérés plus productifs mais de moins bonne qualité. Nous avons confirmé la bonne qualité des prédictions génomiques obtenus dans le factoriel initial sur les nouveaux hybrides évalués dans d’autres environnements et après sélection et observé une bonne corrélation entre les AGC estimées dans le factoriel et dans le dispositif testeurs. Des dispositifs factoriels et testeurs ont été simulés en faisant varier la part d’ASC, le nombre d’hybrides et la contribution de chaque lignée dans le jeu de calibration. A moyens expérimentaux égaux, le dispositif factoriel s’est avéré plus efficace en termes de capacité prédictive et de gain génétique cumulé que le dispositif testeur (jusqu’à +50%) pour un caractère présentant de l’ASC et équivalent pour un caractère purement additif. Les résultats de cette thèse ouvrent de nouvelles perspectives pour revisiter les schémas de sélection hybrides en remplaçant l’évaluation des lignées candidates, classiquement faite sur testeur, par l’évaluation directe d’hybrides issus d’un factoriel incomplet. La mise en œuvre de tels dispositifs nécessitera de réorganiser la logistique des programmes de sélection.

  • Titre traduit

    Marker-assisted prediction of hybrid performance in a reciprocal breeding design : simulations and experimental evaluation for silage maize


  • Résumé

    Maize (Zea mays L.) is the most cultivated crop in the world. To exploit the strong heterosis for traits related to biomass, the genetic diversity of maize is structured into heterotic groups and cultivated varieties are mainly F1 hybrids obtained by crossing lines from complementary groups. The hybrid value can be decomposed as the sum of the General Combining Ability (GCA) of each parental line and the Specific Combining Ability (ASC) of the cross. In northern Europe, maize is often used as silage for animal feed and the breeding objective is to improve productivity while ensuring a good energetic value and digestibility of the silage. The objectives of this thesis were: (i) to estimate the importance of GCA and SCA in hybrid genetic variance for silage quality traits, (ii) to identify loci (QTL) involved in these traits and to study their colocalization with QTL for productivity traits, (iii) to evaluate the interest of genomic selection for the prediction of hybrid performances and (iv) to compare the prediction accuracies of two calibration designs either based on a factorial or on the conventional use of testers from the complementary group. As part of the SAM-MCR project, 6 biparental connected families were created in the "flint" and "dent" groups from 4 founder lines. In a first phase, 822 flint and 802 dent lines were genotyped for 20k SNPs and crossed according to an incomplete factorial to produce 951 hybrids which were phenotyped for quality traits and for productivity traits (studied by H. Giraud during her phD). Quality trait analysis showed a predominance of GCA over SCA and a negative correlation between digestibility traits and silage yield. Several multi-allelic QTLs were detected, most of them being specific to one group. Several colocalizations were found with yield QTL. Using cross-validation, we observed that the predictive ability of models based on detected QTLs was lower than that obtained by genomic predictions. Considering the SCA did not improve model predictive abilities for most of the traits. In a second phase, 90 lines were chosen per group: 30 were selected based on their genomic predictions for productivity and the energetic value and 60 were randomly sampled from the 6 families. These lines were crossed according to an incomplete factorial to produce 360 new hybrids: 120 from selected lines and 240 from randomly chosen lines. The 90 lines of each group were also crossed to two lines of the complementary group (testers). Hybrids from the selected lines were more productive but had a lower silage quality. We confirmed the good accuracy of the genomic predictions obtained in the initial factorial on the new hybrids evaluated in other environments and after selection. We also observed good correlations between GCA estimated in the factorial and in the testcross design. Different factorial and testcross designs were simulated by varying the proportion of dominance/SCA, the number of hybrids and the contribution of each line to the calibration set. Considering the same number of hybrids in the calibration set, the factorial was more efficient in terms of predictive ability and cumulative genetic gain (up to + 50%) than the testcross design for traits showing SCA and was similar for purely additive traits. The results of this thesis open new perspectives to revisit hybrid breeding schemes by replacing the evaluation of candidate lines, classically made on testcross, by the direct evaluation of hybrids resulting from an incomplete factorial. The implementation of such designs will require reorganizing the logistics of selection programs.



Le texte intégral de cette thèse sera accessible librement à partir du 21-03-2020


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Paris-Sud. Service commun de la documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.