An intelligent system for coffee grading and disease identification

par Serawork amsalu Wallelign

Projet de thèse en Informatique

Sous la direction de Cédric Buche.

  • Titre traduit

    Un système intelligent pour le classement du café et l'identification des maladies


  • Résumé

    L'un des facteurs clés du succès des modèles d'apprentissage profond est leur capacité d'apprendre automatiquement des représentations importantes à partir des données d'entrée, sans qu'il soit nécessaire que des experts humains conçoivent des caractéristiques spécifiques aux tâches. Cependant, pour apprendre ces représentations, les méthodes d'apprentissage en profondeur nécessitent généralement de grandes quantités de données, qui sont coûteuses à obtenir, surtout en raison des efforts requis pour recueillir et étiqueter les données. Cette thèse examine l'applicabilité de l'apprentissage en profondeur à des situations du monde réel où les données existent en petites quantités, recueillies à différents endroits (laboratoires), en utilisant différentes techniques d'acquisition et dans des conditions minimales contrôlées. Il y a deux contributions principales. Tout d'abord, nous nous attaquons au problème de la détection des maladies du caféier, qui jusqu'à présent n'était pas abordé dans la littérature, en utilisant un ensemble de données contenant des images de maladies du caféier téléchargées sur Internet et que nous avons capturées à la ferme, et une approche transfert - apprentissage. Il a été possible de concevoir un modèle qui classifie les maladies du caféier avec une précision de 90,18 % en utilisant seulement 562 images du caféier. Deuxièmement, nous nous attaquons au problème du classement des grains de café. Un ensemble de données pour le classement des grains de café est créé en capturant des images de grains de café à la branche Jimma du Commodity Exchange (ECX) de l'Éthiopie en deux séries. Afin de tenter de résoudre le décalage de l'ensemble de données qui s'est produit dans les deux ensembles en raison des différences d'éclairage et de caméra, des algorithmes de correction des couleurs ont été ajoutés au pipeline existant de traitement des images et d'augmentation des données. Toutefois, ces techniques n'ont pas amélioré les performances du modèle par rapport aux méthodes de prétraitement couramment utilisées. Cela indique que la différence dans les techniques d'acquisition d'images n'était pas la seule raison du décalage de l'ensemble de données. Nous avons proposé et évalué une architecture de réseau qui, combinée à des techniques d'augmentation des données et d'apprentissage d'ensemble, a mené à un classificateur amélioré (précision de 89,1 % sur l'ensemble des données d'essai) qui évalue les grains de café et qui est plus performant que les méthodes classiques d'apprentissage machine (amélioration de 25,47 %) et que les modèles prêts-à-servir (18 %). L'ensemble de données sur les grains de café et les modèles seront mis à la disposition du public pour appuyer la poursuite des recherches sur ces sujets importants.


  • Résumé

    One of the key factors in the success of deep learning models is their ability to learn important representations from the input data automatically, without the need for human experts designing task specific features. However, to learn these representations, deep learning methods usually require large amounts of data, which are expensive to obtain especially because of the efforts required for gathering and labeling data. This thesis investigates the applicability of deep learning for real world situations where data exist in small amounts, collected at different locations (labs), using different acquisition techniques and with minimally controlled conditions. There are two main contribution. First, we tackle the problem of coffee plant disease detection, which up to now was not approached in the literature, using a dataset containing images of coffee plant disease downloaded from the internet and that we captured in the farm, and a transfer-learning approach. It was possible to design a model that classifies coffee plant diseases with test accuracy of 90.18% using only 562 images of coffee plant. Second, we tackle the problem of coffee beans grading. A dataset for coffee beans grading is created by capturing images of coffee beans at the Jimma branch of Ethiopia's Commodity Exchange (ECX) in two rounds. In an attempt to solve the dataset shift that occurred in the two sets because of illumination and camera differences, color correction algorithms were added to the existing image processing and data augmentation pipeline. However, these techniques did not improve the performance of the model when compared to the commonly used preprocessing methods. This indicates that the difference in the image acquisition techniques was not the only reason for the dataset shift. We proposed and evaluated a network architecture that combined with data augmentation and ensemble learning techniques, led to an improved classifier (89.1% accuracy on the test dataset) that grades coffee beans, which performs better than the classical machine learning approaches (25.47% improvement) and off-the-shelf deep learning models (18% improvement). The coffee beans dataset and the models will be made publicly available to support further research on these important topics.