Analyse quantitative des données de routine clinique pour le pronostic précoce en oncologie

par Cynthia Perier

Thèse de doctorat en Mathématiques appliquées et calcul scientifique

Sous la direction de Olivier Saut et de Baudouin Denis de Senneville.

Thèses en préparation à Bordeaux , dans le cadre de École doctorale de mathématiques et informatique (Talence, Gironde) , en partenariat avec Institut de mathématiques de Bordeaux (laboratoire) .


  • Résumé

    L'évolution de la texture ou de la forme d'une tumeur à l'imagerie médicale reflète les modifications internes dues à la progression (naturelle ou sous traitement) d'une lésion tumorale. Dans ces travaux nous avons souhaité étudier l'apport des caractéristiques delta-radiomiques pour prédire l'évolution de la maladie. Nous cherchons à fournir un pipeline complet de la reconstruction des lésions à la prédiction, en utilisant seulement les données obtenues en routine clinique. Tout d'abord, nous avons étudié un sous ensemble de marqueurs radiomiques calculés sur IRM, en cherchant à établir quelles conditions sont nécessaires pour assurer leur robustesse. Des jeux de données artificiels et cliniques nous permettent d'évaluer l'impact de la reconstruction 3D des zones d'intérêt et celui du traitement de l'image. Une première analyse d'un cas clinique met en évidence des descripteurs de texture statistiquement associés à la survie sans évènement de patients atteints d'un carcinome du canal anal dès le diagnostic. Dans un second temps, nous avons développé des modèles d'apprentissage statistique. Une seconde étude clinique révèle qu'une signature radiomique IRM en T2 à trois paramètres apprise par un modèle de forêts aléatoires donne des résultats prometteurs pour prédire la réponse histologique des sarcomes des tissus mous à la chimiothérapie néoadjuvante. Le pipeline d'apprentissage est ensuite testé sur un jeu de données de taille moyenne sans images, dans le but cette fois de prédire la rechute métastatique à court terme de patientes atteinte d'un cancer du sein. La classification des patientes est ensuite comparée à la prédiction du temps de rechute fournie par un modèle mécanistique de l'évolution des lésions. Enfin nous discutons de l'apport des techniques plus avancées de l'apprentissage statistique pour étendre l'automatisation de notre chaîne de traitement (segmentation automatique des tumeurs, analyse quantitative de l'oedème péri-tumoral).

  • Titre traduit

    Quantitative analysis of clinical routine data for early prognosis in oncology


  • Résumé

    Tumor shape and texture evolution may highlight internal modifications resulting from the progression of cancer. In this work, we want to study the contribution of delta-radiomics features to cancer-evolution prediction. Our goal is to provide a complete pipeline from the 3D reconstruction of the volume of interest to the prediction of its evolution, using routinely acquired data only. To this end, we first analyse a subset of MRI(-extracted) radiomics biomarquers in order to determine conditions that ensure their robustness. Then, we determine the prerequisites of features reliability and explore the impact of both reconstruction and image processing (rescaling, grey-level normalization). A first clinical study emphasizes some statistically-relevant MRI radiomics features associated with event-free survival in anal carcinoma. We then develop machine-learning models to improve our results. Radiomics and machine learning approaches were then combined in a study on high grade soft tissu sarcoma (STS). Combining Radiomics and machine-learning approaches in a study on high-grade soft tissue sarcoma, we find out that a T2-MRI delta-radiomic signature with only three features is enough to construct a classifier able to predict the STS histological response to neoadjuvant chemotherapy. Our ML pipeline is then trained and tested on a middle-size clinical dataset in order to predict early metastatic relapse of patients with breast cancer. This classification model is then compared to the relapsing time predicted by the mechanistic model. Finally we discuss the contribution of deep-learning techniques to extend our pipeline with tumor automatic segmentation or edema detection.