Aide au Dépistage du Cancer du col de l'utérus par Traitement rapide et automatique de lame de cytologie à l'aide d'apprentissage profond

par Antoine Pirovano

Projet de thèse en Traitement du signal et des images

Sous la direction de Saïd Ladjal et de Isabelle Bloch.

Thèses en préparation à Paris Saclay , dans le cadre de École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne) , en partenariat avec LTCI - Laboratoire de Traitement et Communication de l'Information (laboratoire) , IMAGES : Image, Modélisation, Analyse, GEométrie, Synthèse (equipe de recherche) et de Télécom ParisTech (établissement de préparation de la thèse) depuis le 01-03-2018 .


  • Résumé

    Le cancer du col de l'utérus est le second type de cancers le plus mortel chez la femme après le cancer du sein [1]. En 2012, on estimait à plus d'1/2 le nombre de cancers dépistés dans le monde, dont la moitié se sont révélés mortels pour les patientes. Le dépistage de ce cancer se réalise par observations régulières des cellules du col utérin prélevées à intervalles réguliers (tous les deux à trois ans) par des personnes spécialisées (médecins ou sage femme) et analysées par des cytotechniciens et/ou médecins au sein des laboratoires d'analyses médicales et plus particulièrement de pathologie. En France, 5 millions d'actes de dépistage cytologique sont prescrits chaque année. Sur l'ensemble de ces cas, 90% des observations concluent à un résultat négatif. Or, ces observations au microscope sont extrêmement pénibles et chronophages pour les cytotechniciens et peuvent mobiliser l'avis conjoint de plusieurs experts notamment médecins afin de prendre la décision thérapeutique qui s'impose. Ce processus long et fastidieux a un impact sur la capacité à traiter de très nombreux cas en toute sécurité, facteur déterminant pour assurer une prise en charge sécurisée et adaptée des patientes, évitant les faux négatifs, principale cause de retard au diagnostic et donc au traitement nécessaire en cas de maladie. Le manque d'automatisation et de traçabilité de la lecture en routine des prélèvements cytologiques est une source d'erreurs et donc de faux négatifs, alors que le nombre de d'anatomo-pathologistes diminue un peu plus chaque année et nécessiterait cette automatisation. De ce fait, le passage à l'ère numérique des laboratoires de pathologie devient un véritable enjeu de santé publique pour les patients et d'amélioration pour ces laboratoires de plus en plus soumis à un environnement réglementaire nécessaire. L'apprentissage profond a, depuis 2012, bouleversé le traitement de l'image [2] notamment grâce au réseaux de neurones à convolutions [5]. Il a depuis été grandement étudié dans la théorie et appliqué, avec succès, à de nombreux domaines dont l'imagerie médicale (notamment la cytologie [3] et l'histologie [4]). Le travail de la thèse visera, dans un premier temps, à établir un état-de-l'art du domaine de l'apprentissage profond dans le domaine de l'imagerie médicale afin d'avoir les cartes en mains pour s'attaquer au challenge que représente le traitement rapide et automatique des images (qui sont 3D et qui peuvent atteindre une taille de 100 000 x 100 000 pixels) qui aidera les pathologistes à travailler plus efficacement en fournissant un workflow sur lequel s'appuyer permettant une tracabilité de leur travail. Les principaux défis que doit relever cette thèse sont : - Construire des algorithmes de reconnaissance adaptés à la tâche en particulier assez rapides pour balayer les très grandes images. - Il n'est pas question de se substituer à l'expert humain, il s'agit de lui fournir une aide sous la forme de conseils de régions d'intérêt. De ce point de vue, l'algorithme devra incorporer une dose d'adaptabilité à chaque utilisateur. En effet, les pathologistes ont différentes stratégie d'exploration des images. Le scénario proposé est de faire un léger réapprentissage piloté par chaque pathologiste afin de ne pas bouleverser sa stratégie personnelle d'exploration. Pour relever ces défis l'apprentissage semi-supervisé ([6] ou [7] pour une application au traitement d'images médicales) est la piste à suivre. En effet, l'adaptation à l'utilisateur final ne peut se faire avec une base de données annotée de grande taille. L'utilisateur peut, raisonnablement, pointer quelques régions, suite à quoi l'adaptation du système global doit être effectuée. L'utilisation de l'apprentissage profond, dans ce contexte, appelle des adaptations notamment en ce qui concerne la taille de l'échantillon d'apprentissage. Ainsi, la partie qui aura à être adaptée ne devra pas avoir une capacité trop importante (qui impliquerait une base de donnée d'apprentissage en rapport). Une autre piste à explorer est l'analyse des stratégies de balayage des praticiens. Savoir comment un pathologiste se guide pour aller vers les régions d'intérêt peut apporter des solutions pour résoudre le problème de la taille de chaque donnée patiente (10^11 pixels/patiente). De ce point de vue nous envisageons une approche multi-échelle [9,10] avec l'établissement de règles de décision (apprises ou ad hoc) pour l'abandon de certaines régions à des niveaux de résolution bas. Ce problème se pose dans de nombreux domaines (voir, par exemple, [8] pour de la classification en imagerie satellitaire). Il a été abordé du point de vue de l'apprentissage profond, ce qui a conduit aux R-CNN [11], qui consistent à proposer des régions éventuellement prometteuses avant d'utiliser un réseau convolutionnel. La proximité de Keen Eye avec des expert permettra de raffiner ces choix de proposition et éventuellement d'identifier si les différents stratégies des utilisateurs finaux peuvent être expliqués par des features extraits aux échelles grossières.

  • Titre traduit

    Automatic Cervical cancer detection using deep learning


  • Résumé

    Cervical cancer is one of the most deadly cancers among women. Nowadays, every woman of a certain age undergoes on regular basis. The resulting samples are analysed by cytologists. The résulting images are huge (10^11 pixels) and this task is cumbersome. The goal of this thesis is to provide the user with an automated solution pointing him to the most suspicious regions, without disturbing his routine. Hence, the algorithm should be able to learn the specific methodology of each end user. This adaptation must be as light as possible. The tools used during this thesis include deep learning methods, transfer learning and classical scale-space methods.