Extraction de caractéristiques radiomiques pour l'identification de patients répondeurs en oncologie hépatique et pulmonaire

par Vincent Couteaux

Projet de thèse en Mathématiques et Informatique

Sous la direction de Isabelle Bloch et de Olivier Nempont.

Thèses en préparation à Paris Saclay , dans le cadre de Sciences et Technologies de l'Information et de la Communication , en partenariat avec LTCI - Laboratoire de Traitement et Communication de l'Information (laboratoire) , IMAGES : Image, Modélisation, Analyse, GEométrie, Synthèse (equipe de recherche) et de Télécom ParisTech (établissement de préparation de la thèse) depuis le 01-05-2018 .


  • Résumé

    La radiomique et la médecine de précision sont des disciplines naissantes. De plus, la combinaison de données d'imagerie hétérogènes (CT / IRM ou radiologie / anatomo-pathologie, par exemple) en oncologie hépatique ou pulmonaire est encore peu répandue. Un consensus semble s'être établi quant aux caractéristiques radiomiques définies manuellement (handcrafted features), en particulier pour la caractérisation de texture avec, par exemple, les gray-level co-occurrence (GLCM) et run length matrices (GLRLM) [Par17]. Cependant, peu de caractéristiques prennent en compte des données multimodales et/ou hétérogènes. De plus, l'utilisation de méthodes permettant l'extraction automatique de telles caractéristiques semble tout à fait pertinente. Dans ce but, les approches par apprentissage profond de réseaux de neurones (Deep Learning) semblent particulièrement adaptées. La thèse s'articulera autour des trois objectifs principaux suivants. 1. Structuration et analyse des données de radiologie et d'anatomo-pathologie Le premier objectif sera de mettre en place : une base de données structurée, intégrant les données de patients brutes, normalisées, ainsi que les annotations correspondantes ; une chaîne de traitement radiomique complète, permettant de parcourir, de traiter et d'analyser les données de patients disponibles. Dans le cadre du projet RIHDO, les données radiologiques et anatomo-pathologiques de plusieurs centaines de patients seront disponibles tout au long des études rétrospectives puis prospectives. Dans un premier temps, le doctorant participera à la mise en place des outils nécessaires à l'annotation des images. Pour cela, Philips / Medisys mettra à sa disposition des logiciels de recalage et de segmentation afin de délinéer les tumeurs [Pre13]. Les données hétérogènes brutes mises à disposition seront déjà colligées. Cependant, afin d'être exploitables, le doctorant devra créer un référentiel commun à tous les patients, afin de pouvoir comparer les caractéristiques entre les images et entre les patients. Les annotations et les données des patients seront ensuite intégrées puis structurées dans une base de données. Il s'agira donc de définir des critères de sélection des données des patients, de normaliser ces dernières (en particulier les images d'IRM) et de les recaler. 2. Extraction automatique et analyse de caractéristiques radiomiques à partir de données multimodales et / ou hétérogènes Dans le cadre de l'oncologie hépatique et pulmonaire, le deuxième objectif sera : de définir, de sélectionner et d'extraire automatiquement de nouvelles caractéristiques radiomiques pertinentes, prenant en compte des données multimodales et / ou hétérogènes ; d'analyser certaines de leurs propriétés : sensibilité aux contours tumoraux, orthogonalité, interprétabilité, etc. L'extraction de caractéristiques radiomiques est l'un des points clés de la chaîne de traitement radiomique. Or, la littérature en oncologie fournit peu d'exemples de signatures radiomiques définies sur des données multimodales et / ou hétérogènes. Le doctorant devra proposer de nouvelles caractéristiques radiomiques afin de définir de telles signatures. Ces caractéristiques pourront être validées sur les données pulmonaires CT / PET ou CT seulement (dans un premier temps), la littérature en radiomique étant plus fournie dans ce domaine. La chaîne de traitement de classification et de stratification des patients, mise en place dans le premier objectif, fournira également un critère d'évaluation a posteriori. Le doctorant devra également fournir une analyse détaillée de ces nouvelles caractéristiques radiomiques. Que ce soit dans des images CT ou d'IRM, la segmentation des tumeurs est sujette à une forte variabilité intra- et inter-observateur. Une analyse de sensibilité par rapport aux contours tumoraux sera donc effectuée. De plus, afin de préparer au mieux les caractéristiques radiomiques pour l'algorithme de classification (par exemple), il est souvent important de minimiser la redondance de l'information. A cette fin, le doctorant s'intéressera aux problèmes de fusion des caractéristiques ou de réduction de dimensionnalité, de sélection et d'orthogonalité des caractéristiques. Enfin, l'acceptation par la communauté médicale d'algorithmes de prédiction se trouve facilitée lorsque les mécanismes des processus de décision et les spécificités sur lesquelles s'appuient les prédicteurs appris sont compris. Ces points seront en particulier étudiés pour les approches par apprentissage profond auxquelles on reproche souvent leur opacité. 3. Identification et stratification des patients répondant à des traitements spécifiques Le troisième objectif de cette thèse sera de mettre en place un prédicteur permettant l'identification et / ou la stratification des patients répondant à des traitements spécifiques en fonction de leur phénotype d'imagerie. Plusieurs solutions sont envisagées. Dans le contexte de l'apprentissage profond, le prédicteur pourra être appris de bout-en-bout, et donc intégrer l'extraction des caractéristiques et la classification. Dans une autre approche, seules les caractéristiques apprises pourront être retenues et utilisées en entrée d'autres méthodes de classification. On envisagera également d'incorporer des caractéristiques définies manuellement. A nouveau, afin de faciliter l'acceptation de ces méthodes, il sera intéressant d'étudier les méthodes permettant d'interpréter un résultat de prédiction en particulier par rapport aux données de patients fournies en entrée de la chaîne de traitement.

  • Titre traduit

    Radiomic feature extraction for liver and lung oncology


  • Résumé

    This thesis will deal with radiomic feature extraction for applications in oncology (liver and lungs). It will focus on three main objectives: - Structuring and analyzing radiologic and histologic data. - Automatic extraction and analysis of radiomic features from multimodal and heterogeneous data, using convolutional networks, and comparison with handcrafted features. - Predicting patient's treatment outcome.