Thèse soutenue

Méthodes de rang faible pour les données hétérogènes et multi-source

FR  |  
EN
Auteur / Autrice : Geneviève Robin
Direction : Éric MoulinesJulie Josse
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 11/06/2019
Etablissement(s) : Université Paris-Saclay (ComUE)
Ecole(s) doctorale(s) : École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : établissement opérateur d'inscription : École polytechnique (Palaiseau, Essonne ; 1795-....)
Laboratoire : Centre de mathématiques appliquées (Palaiseau, Essonne) - Modélisation en pharmacologie de population
Jury : Président / Présidente : Francis Bach
Examinateurs / Examinatrices : Éric Moulines, Julie Josse, Francis Bach, Jérémie Bigot, Stéphane Robin, Gérard Biau, Karim Lounici
Rapporteurs / Rapporteuses : Jérémie Bigot, Trevor J. Hastie

Résumé

FR  |  
EN

Dans les applications modernes des statistiques et de l'apprentissage, il est courant que les données récoltées présentent un certain nombre d'imperfections. En particulier, les données sont souvent hétérogènes, c'est-à-dires qu'elles contiennent à la fois des informations quantitatives et qualitatives, incomplètes, lorsque certaines informations sont inaccessibles ou corrompues, et multi-sources, c'est-à-dire qu'elles résultent de l'agrégation de plusieurs jeux de données indépendant. Dans cette thèse, nous développons plusieurs méthodes pour l'analyse de données hétérogènes, incomplètes et multi-source. Nous nous attachons à étudier tous les aspects de ces méthodes, en fournissant des études théoriques précises, ainsi que des implémentations disponibles au public, et des évaluations empiriques. En particulier, nous considérons en détail deux applications issues de l'écologie pour la première et de la médecine pour la seconde.