Influence de la distribution des classes et évaluation en apprentissage profond : application à la détection du cancer sur des images histologiques
Auteur / Autrice : | Ismat Ara Reshma |
Direction : | Hervé Luga, Josiane Mothe |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 20/09/2021 |
Etablissement(s) : | Toulouse 1 |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, informatique et télécommunications (Toulouse) |
Partenaire(s) de recherche : | Equipe de recherche : Institut de Recherche en Informatique de Toulouse (1995-....) |
Mots clés
Résumé
Le cancer est une maladie mortelle considérée comme la deuxième cause de décès. Toute avancée dans le diagnostic et la détection du cancer est donc cruciale pour sauver des vies. L’analyse d’images histologiques - également appelées Whole Slide Images (WSI) - est considérée comme la référence dans le diagnostic et l’étude du stade du cancer. L’analyse manuelle de ces images par les pathologistes reste le principal processus de diagnostic. Il prend du temps, est laborieux, sujet aux erreurs et difficile à évaluer de manière reproductible. Les techniques de diagnostic assisté par ordinateur peuvent aider les pathologistes dans leur travail. Les techniques d’apprentissage automatique, en particulier les algorithmes d’apprentissage profond, tels que les réseaux de neurones convolutifs (CNN), sont largement utilisés dans divers domaines dont l’analyse d’images. Le succès des modèles CNN dépend cependant de plusieurs hyper-paramètres, tels que l’architecture du réseau, les données utilisées pour entraîner le modèle et la distribution des données d’entraînement. A notre connaissance, parmi les hyper-paramètres, la distribution des données d’entraînement n’est pas encore étudiée dans la littérature pour les données WSI, alors qu’elle pourrait être l’un des critères les plus importants pour réguler les performances du modèle. L’un des objectifs de cette thèse est d’étudier en profondeur l’impact de la répartition des classes tant au stade de l’apprentissage qu’au stade du test ou de la prévision. Un autre objectif de cette thèse est lié à l’évaluation au sens large. Nous avons étudié des moyens d’évaluer les résultats qui correspondent davantage aux objectifs du pathologiste et résolvent les problèmes des métriques actuelles qui souffrent de leur incapacité à distinguer les modèles dans de nombreux cas, manquent d’informations concernant les fausses prédictions et sont optimistes dans le cas de données déséquilibrées. Considérant à la fois la distribution des classes et l’évaluation de la détection du cancer à partir des WSI, les contributions spécifiques de cette thèse sont les suivantes : la première contribution principale de cette thèse est d’étudier l’efficacité de la distribution équilibrée dans la détection automatique du cancer qui est utilisée dans de nombreuses études. Nous proposons une approche systématique pour analyser la distribution des classes des données WSI dans l’ensemble d’apprentissage, pour proposer différentes hypothèses sur la distribution des classes et tester ces hypothèses en utilisant trois ensembles de données et deux architectures CNN, le réseau U-net et le réseau convolutif équivariant de groupe (G-CNN). Nous introduisons également une méthode d’évaluation basée sur les régions de l’image alternative à la méthode habituelle basée sur les pixels. Elle permet d’obtenir une meilleure correspondance par rapport à la façon dont un pathologiste vérifie les images. Nous avons constaté que la distribution équilibrée n’est pas optimale pour l’entrainement d’un CNN, et qu’avec la distribution biaisée par classe, il est possible d’infléchir le modèle vers la précision souhaitée (par exemple, vers le rappel ou la précision). Ces résultats constituent une avancée pour comprendre le comportement du modèle vis-à-vis des différentes distributions de classes dans l’ensemble d’apprentissage. La deuxième contribution principale de cette thèse est de développer une représentation continue basée sur un seuil des courbes de précision et de rappel (PR-T) comme alternative aux courbes de caractéristiques de fonctionnement du récepteur (ROC) et de précision-rappel (PR), les métriques d’évaluation usuelles en classification binaire. De plus, nous avons développé des algorithmes de bout en bout pour calculer la courbe PR moyenne et la moyenne de l’aire sous la courbe (PR-AUC).