Méthodes de rang faible pour les données hétérogènes et multi-source
Auteur / Autrice : | Geneviève Robin |
Direction : | Éric Moulines, Julie Josse |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées |
Date : | Soutenance le 11/06/2019 |
Etablissement(s) : | Université Paris-Saclay (ComUE) |
Ecole(s) doctorale(s) : | École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....) |
Partenaire(s) de recherche : | établissement opérateur d'inscription : École polytechnique (Palaiseau, Essonne ; 1795-....) |
Laboratoire : Centre de mathématiques appliquées (Palaiseau, Essonne) - Modélisation en pharmacologie de population | |
Jury : | Président / Présidente : Francis Bach |
Examinateurs / Examinatrices : Éric Moulines, Julie Josse, Francis Bach, Jérémie Bigot, Stéphane Robin, Gérard Biau, Karim Lounici | |
Rapporteurs / Rapporteuses : Jérémie Bigot, Trevor J. Hastie |
Mots clés
Résumé
Dans les applications modernes des statistiques et de l'apprentissage, il est courant que les données récoltées présentent un certain nombre d'imperfections. En particulier, les données sont souvent hétérogènes, c'est-à-dires qu'elles contiennent à la fois des informations quantitatives et qualitatives, incomplètes, lorsque certaines informations sont inaccessibles ou corrompues, et multi-sources, c'est-à-dire qu'elles résultent de l'agrégation de plusieurs jeux de données indépendant. Dans cette thèse, nous développons plusieurs méthodes pour l'analyse de données hétérogènes, incomplètes et multi-source. Nous nous attachons à étudier tous les aspects de ces méthodes, en fournissant des études théoriques précises, ainsi que des implémentations disponibles au public, et des évaluations empiriques. En particulier, nous considérons en détail deux applications issues de l'écologie pour la première et de la médecine pour la seconde.