Apprentissage automatique avec parcimonie structurée: Application au phénotypage basé sur la neuroimagerie pour le trouble du spectre autistique et la schizophrénie

par Amicie De Pierrefeu

Projet de thèse en Imagerie et physique médicale

Sous la direction de Philippe Ciuciu et de Edouard Duchesnay.

Thèses en préparation à Paris Saclay , dans le cadre de Electrical,Optical,Bio: PHYSICS_AND_ENGINEERING , en partenariat avec Unité d'analyse et de traitement de l'information (laboratoire) et de Université Paris-Sud (établissement de préparation de la thèse) depuis le 01-10-2015 .


  • Résumé

    La schizophrénie est une maladie dévastatrice (1% de la population) et très coûteuse pour les familles affectées et la société. Dans le paradigme émergent de la médecine personnalisée, la question est de fournir un traitement précoce et adapté. L'identification de biomarqueurs de neuro-imagerie de la vulnérabilité offre de nouvelles perspectives de découverte précoce et de suivi et sujets “à risque de maladie mentale”. Ce Sujet de thèse, est à l'interface de la recherche clinique (INSERM UMR 894, Hôpital St-Anne, Paris) et méthodologique (NeuroSpin, CEA Saclay). Nous visons à utiliser et améliorer les récentes avancées sur des algorithmes d'apprentissage automatique pour l'identification de biomarqueurs cérébraux du risque de psychose.

  • Titre traduit

    Machine Learning with Structured Sparsity: Application to Neuroimaging-based Phenotyping in Autism Spectrum Disorder and Schizophrenia


  • Résumé

    Context A major limitation to understand the biological basis of Schizophrenia (SCZ) is its overlapping with other developmental conditions such as autism spectrum disorder (ASD). Our colleagues at the INSERM UMR 894 unit in St-Anne Hospital, Paris, headed by Pr Marie-Odile Krebs, have collected two unique cohorts: (i) the AUSZ cohort focuses on the continuum between ASD and SCZ; (ii) the ICAAR cohort involved adolescents at-risk-of SCZ. The overall goal is to develop machine learning algorithms to identify brain imaging predictors of the ASD to SCZ continuum. Those markers will point the brain overlaps between the two conditions, but more interestingly, they will highlight the brain patterns that are specific to SCZ. Methods Neuroimaging-based phenotyping has to deal with the high dimensionality of the data through constraints applied on the learning process using algorithms like Support Vector Machine (SVM). Such algorithms has already been made available to the 'big data' community through software library like scikit-learn (http://scikit-learn.org). This library, developed at NeuroSpin initially for neuroimaging purposes, is the most active machine learning in python. Recently, we proposed to go beyond classical SVMs by exploiting the known spatial structure of brain images. ParsimonY (https://github.com/neurospin/pylearn-parsimony) is a python extension of scikit-learn for structured input (brain images, genetics) that promotes the learning algorithm to make an extensive use of prior (biological) knowledges about the data. We investigated total variation (TV) to constrain the imaging predictors to be structured in compact clusters preventing the brain map of predictors to be widespread and scattered. Structured Sparsity in learning requires to add a non-differentiable penalty in the optimization procedure which disable classical gradient descent methods. To overcome this problem we developed original proximal algorithms that are well suited for convex but non-differentiable optimization problems.