Algorithmes rapides d'optimisation en ligne pour l'apprentissage et l'imagerie médicale

par Marie-caroline Corbineau

Projet de thèse en Mathématiques et Informatique

Sous la direction de Jean-Christophe Pesquet et de Emilie Chouzenoux.

Thèses en préparation à Paris Saclay , dans le cadre de Sciences et Technologies de l'Information et de la Communication , en partenariat avec [CVN] Centre de la Vision Numérique (laboratoire) et de CentraleSupélec (établissement de préparation de la thèse) depuis le 01-10-2016 .


  • Résumé

    L'apprentissage 'en ligne'' est une approche très populaire pour l'extraction de connaissances à partir de flux de données, en particulier dans le contexte de la classification supervisée. Ceci est particulièrement avantageux dans les applications traitant de données de très grande taille et/ou en très grande quantité. L'objectif de cette thèse est de concevoir des algorithmes généraux et efficaces pour l'apprentissage parcimonieux en ligne. Afin de permettre un traitement de grands jeux de données tels que ceux rencontrés en imagerie médicale, des stratégies de minimisation alternée par blocs, et/ou parallèles seront envisagées. On s'attachera également à définir des méthodes permettant une classification adaptative à de potentielles variations des statistiques du flux entrant, ce qui représente une rupture par rapport aux approches d'apprentissage en ligne existant dans la littérature. D'un point de vue algorithmique, plusieurs verrous doivent être levés. Tout d'abord, il serait intéressant de pouvoir gérer efficacement des fonctions de coût non quadratiques (hinge, logistique, …) dans les approches adaptatives. Un second aspect du travail concernera l'extension des approches par majoration-minimisation (MM) au cadre primal-dual afin de pouvoir optimiser efficacement des variables vivant sur des structures de graphes issues de modèles graphiques potentiellement d'ordre supérieur rencontrées en segmentation d'images. Il serait, par ailleurs, utile de pouvoir combiner des stratégies d'optimisation par blocs / parallèle avec les approches en ligne.

  • Titre traduit

    Fast online optimization algorithms for machine learning and medical imaging applications


  • Résumé

    Online learning is a very popular approach for extracting useful information from input data, for instance for supervised classification. Online strategies are of particular interest when dealing with massive datasets. In the context of the resolution of large scale optimization problems such as those encountered in medical imaging, we will consider the combination of online methods with block alternating approaches, and/or parallel computing methods. We will also search for online techniques able to adapt themselves to potential variations in the statistics of the incoming data, which constitutes a main novelty with respect to the available state-of-the-art online algorithms. From an algorithmic viewpoint, the following problems should be addressed. First, it would be interesting to account for non quadratic cost functions (hinge, logistic, ..) in online learning algorithms. A second aspect of the work will focus on the extension of majorize-minimize (MM) methods to the primal-dual framework, with the aim to optimize efficiently graph variables arising from high order graphical models involved in computer vision problems. Finally, it would be useful to search for new optimization strategies that combine online optimization techniques with block coordinate / parallel computing strategies.