Thèse soutenue

Le défi de l’estimation robuste des traits avec l’apprentissage profond sur des images RVB à haute résolution

FR  |  
EN
Auteur / Autrice : Etienne David
Direction : Frédéric Baret
Type : Thèse de doctorat
Discipline(s) : Sciences Agronomiques
Date : Soutenance le 02/11/2021
Etablissement(s) : Avignon
Ecole(s) doctorale(s) : École doctorale 536 « Sciences et agrosciences » (Avignon)
Partenaire(s) de recherche : Laboratoire : Environnement Méditerranéen et Modélisation Agro-Hydrosystèmes (Avignon)
Jury : Président / Présidente : Alexis Joly
Examinateurs / Examinatrices : Karine Chenu, Marion Prudent
Rapporteurs / Rapporteuses : Alexis Joly, Tony Pridmore

Mots clés

FR  |  
EN

Mots clés contrôlés

Résumé

FR  |  
EN

Le phénotypage à haut débit des plantes, notamment dans le cadre d’acquisitions en plein champ, repose sur l’interprétation de données issues de différents capteurs mis en œuvre sur des vecteurs variés tels que des tracteurs, des robots ou des drones. Initialement, ces données étaient interprétées à l’aide d’algorithmes de télédétection exploitant la résolution spectraledu signal. Mais depuis 2015, les progrès du ”Deep Learning”, basé sur l’entrainement à partir d’exemples, ont permis des résultats prometteurs pour mesurer des traits essentiels comme le taux de couverture ou le comptage de plantes ou d’organes. Ces algorithmes utilisent des couches de convolution apprises, permettant de tirer parti de l’organisation spatiale du signal. L’avantage de ces méthodes est qu’elles sont basées sur des capteurs Rouge-Vert-Bleu (RVB), qui sont beaucoup moins coûteux que les imageurs multi- ou hyperspectraux. Cependant, les algorithmes de Deep Learning sont sensibles aux changements de la distribution entre les données utilisées pour l’entrainement et les données prédites. En pratique, des erreurs de prédiction variables et non prédictibles d’un site à l’autre peuvent être observées. L’objectif de la thèse est de comprendre les causes de ces variations et de proposer des solutions pour des estimations de traits phénotypiques fiables en utilisant le Deep Learning. L’étude porte sur la détection de plantes et d’organes à partir d’images RVB haute résolution acquises sur le terrain. Nos travaux ont d’abord porté sur la constitution de bases de données d’images diversifiées provenant de différents lieux et stades de développement pour l’émergence de plantes (maïs, betterave, tournesol) et les épis de blé, ce qui a permis la publication de deux bases de données annotées, regroupant 27 sessions d’acquisition pour le drone et 47 pour la détection d’épis. Ces jeux de données démontrent la différence de performances entre les résultats publiés et les nôtres en raison du changement de distribution. Pour dépasser les limites des méthodes habituelles, nous avons organisé deux concours de données, les Global Wheat Challenges, en 2020 et 2021, qui nous ont permis d’obtenir des solutions entraînées pour la robustesse sur un jeu de données différent de celui de l’entraînement. L’analyse des solutions a montré l’importance des stratégies d’entraînement pour la robustesse au delà des architectures utilisées. Nous avons également montré que ces solutions peuvent être déployées efficacement en remplacement du comptage manuel. Enfin, nous avons démontré l’inefficacité des fonctions d’entraînement conçues pour l’entraînement robuste. Notre travail ouvre la perspective d’une meilleure évaluation du Deep Learning dans le contexte du phénotypage à haut débit et donc de la confiance dans son utilisation en conditions réelles.