Analyse multifactorielle de la performance des cultures - Méthodes et automatisation pour l’intégration de données agronomiques, environnementales, sociales et économiques - Exemple du maïs grain non-irrigué en Amérique du Nord

par Thomas Galinier

Thèse de doctorat en Mathématiques appliquées

Sous la direction de Paul-Henry Cournède et de Jeremie Lecoeur.

Le président du jury était Céline Hudelot.

Le jury était composé de Paul-Henry Cournède, Jeremie Lecoeur, Amélie Rostand-Mathieu.

Les rapporteurs étaient Lydie Guilioni, David Causeur.


  • Résumé

    La demande mondiale de nourriture et d’energie est en constante augmentation. L’accès à de nouvelles terres arables étant limité, les agriculteurs devront produire environ 70% de plus par hectare d'ici 2050. L'optimisation et la rationalisation des systèmes de production agricole sont essentielles pour assurer la sécurité alimentaire des populations dans des conditions durables. La communauté agricole serait en mesure d'optimiser les performances des cultures en ayant accès à une meilleure compréhension des systèmes de production, notamment concernant leur potentiel et principaux facteurs limitants. Dans ce contexte, la caractérisation des conditions de croissance des cultures prenant en compte leurs impacts sur le potentiel de production et sur les pertes de rendement est importante pour identifier les marges de progrès et proposer des systèmes agricoles améliorés.Dans cette étude une approche est proposée pour caractériser l'environnement de grandes zones géographiques prenant en compte les impacts des ressources clés au développement des plantes (température, rayonnement, eau et azote) sur la performance des cultures. Le niveau de disponibilité de ces ressources a été estimé en utilisant des approches de modélisation de culture, intégrant données météorologiques et caractéristiques de sol. L'efficacité d'utilisation des ressources disponibles a été caractérisée par les pratiques culturales ainsi que la stratégie et l’environnement technique des agriculteurs. Une procédure générique d’intégration de la donnée a été établie et utilisée pour décrire la production de maïs grain en Amérique du Nord de 1991 à 2013. Le jeu de données résultant de cette intégration couvre 84% des superficies plantées en maïs, décrites par 1 558 unités spatiales élémentaires, pour un total de 28 303 scénarios indépendants. Cette méthode combine et harmonise les observations de rendement issues des statistiques agricoles avec un large ensemble de descripteurs pertinents de conditions de croissance.Un sous-ensemble de 21 facteurs limitants a été identifié par une analyse de sélection de variables pour expliquer 66% de la variabilité des pertes de rendement observées. Compte tenu du nombre de dimensions du jeu de donnée, la méthode relaxed lasso a été choisie comme un compromis intéressant entre capacité de prédiction et d’interprétation. Les descripteurs sélectionnés montrent la contribution de la gestion des cultures à la variabilité des pertes de rendement, en particulier les niveaux d'intensification de l’agriculture et l’environnement technique des agriculteurs. Le troisième facteur principal est la disponibilité en eau et la sécheresse qui en résulte. L’utilisation des connaissances en physiologie dans la conception de descripteurs a considérablement amélioré la capacité d’interprétation de la proposition et la confiance des utilisateurs finaux dans l'approche.La structure des facteurs limitant le rendement a été utilisée pour identifier les Environnements Types les plus fréquents. Deux approches ont été proposes : l’une axée uniquement sur les facteurs physiologiques et l’autre intégrant également l’identification de marchés de taille homogène. 11 Environnements Types ont été identifiés en fonction des facteurs physiologiques et 8 en combinant facteurs physiologiques et contraintes de taille de marché. Les Environnements Types basés sur les facteurs physiologiques sont très informatifs sur l'évolution historique des pratiques culturales et les changements de stratégie des agriculteurs au cours du temps. Une telle catégorisation des conditions de croissance a montré des capacités à reproduire l'expertise de terrain et à soutenir l'évaluation de génotypes. Trois cas d'utilisation ont servi à illustrer l'intérêt de l'approche pour (i) décrire l'historique environnemental d'un marché, (ii) définir des populations d’Environnements cibles (TPE) et (iii) évaluer la pertinence de l'échantillonnage environnemental de réseaux multi-lieux (MET).

  • Titre traduit

    Multifactorial analysis of crop performance - Method and automation of agronomical, environmental and socio-economic data integration - Example of non-irrigated corn for grain in North America


  • Résumé

    The global demand for food and energy is constantly increasing. As access to spare arable land is limited, growers will have to produce about 70% more per hectare by 2050. Optimization and rationalization of the agricultural production systems is then critical to ensure food security under sustainable conditions. The agricultural community would be in a position to optimize crop performance by better understanding the cropping systems, especially regarding potential production and limiting factors. In this context, the ability to characterize crop growing conditions in regards to their impacts on potential yield and yield gap is important in order to identify margins of progress and propose improved farming systems.An approach is proposed to characterize the crop environment of large geographical areas taking into consideration the impact on crop performance of the key resources for plant development (temperature, solar radiation, water and nitrogen). The level of availability of each resource was estimated by using crop modeling approaches integrating weather data and soil characteristics as inputs. The efficiency of use of the available resources was characterized by crop practices, grower strategy and grower technical environment. A generic integration procedure was established and used to describe corn production for grain in North America from 1991 to 2013. The resulting dataset covers 84% of the total corn planted area, deciphered in 1,558 elementary spatial units, for a total of 28,303 independent scenarios. Such a method combines and harmonizes, at scale, yield observations from agricultural statistics with a large set of relevant descriptors of growing conditions.A subset of 21 main limiting factors was identified through variable-selection analysis to explain 66% of the observed yield-gap variability. The relaxed lasso method resulted in an interesting compromise between interpretability and prediction ability. The selected descriptors highlighted the contribution of crop management in yield-gap variability, especially regarding levels of crop intensification and the technical environment of growers. The third main factor is water availability and resulting drought. The integration of knowledge in crop physiology into descriptor design significantly improved the interpretability of the proposal and the confidence of end-users in the approach.Yield-gap patterns were used to identify the set of most frequent Environment Types. Two approaches were proposed: one focused on crop physiology drivers and another also considered market-size homogeneity among Environment Types. This resulted in 11 Environment Types based on crop physiology drivers and 8 Environment Types when combining crop physiology drivers and market constraints. Crop-physiology Environment Types are very informative on the historical evolution of cultural practices and the changes in grower strategies over the studied period. Such categorization of growing conditions demonstrated the ability to reproduce field expertise and support genotype evaluation. Three business Use Cases were used to illustrate the interest of the approach in (i) describing the environmental history of a market, (ii) defining relevant Target Population Environments (TPE) and (iii) evaluating the environmental sampling relevance of Multi-Environment Trials (MET).



Le texte intégral de cette thèse n'est pas accessible en ligne.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : CentraleSupélec. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.