Thèse soutenue

L'intelligence artificielle appliquée à la pathologie numérique pour découvrir de nouveaux prédicteurs de l'évolution des patientes atteintes d'un cancer du sein

FR  |  
EN
Auteur / Autrice : Ingrid Garberis
Direction : Fabrice AndréMagali Lacroix-Triki
Type : Thèse de doctorat
Discipline(s) : Sciences de la vie et de la santé
Date : Soutenance le 19/12/2022
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Cancérologie, Biologie, Médecine, Santé
Partenaire(s) de recherche : Laboratoire : Prédicteurs moléculaires et nouvelles cibles en oncologie (Villejuif, Val-de-Marne ; 2010-....)
référent : Université Paris-Saclay. Faculté de médecine (Le Kremlin-Bicêtre, Val-de-Marne ; 2020-....)
graduate school : Université Paris-Saclay. Graduate School Life Sciences and Health (2020-....)
Jury : Président / Présidente : Jean-Yves Scoazec
Examinateurs / Examinatrices : Jean-Yves Scoazec, Emmanuelle Charafe-Jauffret, Nathalie Rioux-Leclercq, Frédérique Penault-Llorca
Rapporteurs / Rapporteuses : Emmanuelle Charafe-Jauffret, Nathalie Rioux-Leclercq

Résumé

FR  |  
EN

L'intelligence artificielle (IA) émerge en médecine comme un nouvel outil pour améliorer la précision des stratégies diagnostiques. En identifiant les trames de reconnaissance visuelle, l'IA permet le traitement de grands ensembles de données qui, en raison de leur échelle et de leur diversité, pourraient être très difficiles à gérer s'ils étaient analysés manuellement. L'apprentissage profond (AP), un domaine de l'apprentissage automatique ou machine learning où la profondeur est générée par une séquence de couches, est une approche idéale pour la reconnaissance visuelle, comme le traitement de lames histologiques numérisées. Le mécanisme est basé sur l'entraînement d'algorithmes pour concevoir des modèles mathématiques capables de prédire la configuration dans des cas futurs. L'« entraînement » consiste à fournir d'énormes quantités de données au système et à permettre à l'algorithme de s'ajuster et de s'améliorer. Le cancer du sein (CS) est la première cause de cancer chez les femmes dans le monde. Les CS invasifs sont classés par les pathologistes en différents sous-types en fonction du grade et du type histologique et d'autres caractéristiques telles que la taille tumorale, la présence d'une invasion lympho-vasculaire, l'atteinte des ganglions lymphatiques, l'expression des récepteurs hormonaux et de HER2, ou l'index de prolifération évalué par le Ki67, avec différentes implications pronostiques et prédictives. La vaste hétérogénéité du CS a un impact particulier dans le pronostic et la réponse au traitement. De plus, il a été démontré que le risque et le moment de la récidive de la maladie dépendent également des caractéristiques tumorales mentionnées. Ce fait souligne le besoin de meilleurs outils pour la stratification des patients concernant la prise de décision thérapeutique, à la fois pour la mise en œuvre de traitements adaptés et aussi pour éviter des traitements lourds chez les patients identifiés comme ayant un risque faible de récidive. L'applicabilité de l'IA sur la pathologie numérique pourrait gérer la grande quantité de données générées afin d'optimiser son interprétation, améliorant ainsi la reconnaissance des différents sous-groupes du CS précoce qui pourraient s'associer à différentes évolutions.L'objectif de ce travail était de développer un outil de pathologie numérique basé sur l'IA pour évaluer le risque de rechute à distance à 5 ans chez les patients avec un CS invasif en phase précoce, applicable partout et à un coût abordable. Nous avons utilisé des lames tumorales colorées par hématoxyline-éosine-safran (HES) et scannées, provenant de résections chirurgicales de CS, ainsi que des données cliniques et histopathologiques, comme données d'entrée pour entraîner des réseaux de neurones afin de prédire un risque de rechute. Dans un deuxième temps, nous avons validé les résultats obtenus sur un jeu de données externe et nous avons comparé nos performances à des scores cliniques pertinents utilisés dans la pratique quotidienne, atteignant des valeurs équivalentes ou supérieures en termes de sensibilité et de spécificité. Enfin, et concernant la question de l'explainable AI, nous avons évalué les caractéristiques présentes dans les tuiles sélectionnées par les modèles mathématiques afin d'identifier les éléments responsables de la prédiction du risque, et de valider biologiquement notre approche. Nous avons conclu que notre étude met en évidence les avantages de l'IA appliquée à la pathologie numérique pour améliorer la stratification du risque des patientes atteintes d'un CS et pour élargir l'accès à des stratégies thérapeutiques personnalisées, y compris la désescalade thérapeutique.