Au-delà de la tâche d’entraînement en classification : élargir la notion de généralisation
Auteur / Autrice : | Raphaël Baena |
Direction : | Vincent Gripon |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 01/12/2023 |
Etablissement(s) : | Ecole nationale supérieure Mines-Télécom Atlantique Bretagne Pays de la Loire |
Ecole(s) doctorale(s) : | École doctorale Sciences pour l'ingénieur et le numérique |
Partenaire(s) de recherche : | Laboratoire : Equipe Algorithm Architecture Interactions - Département Mathematical and Electrical Engineering - Laboratoire en sciences et techniques de l'information, de la communication et de la connaissance |
Jury : | Président / Présidente : Pierre Borgnat |
Examinateurs / Examinatrices : Vincent Gripon, Nicolas Courty, David Picard, Claire Boyer, Lucas Drumetz | |
Rapporteurs / Rapporteuses : Nicolas Courty, David Picard |
Mots clés
Résumé
La thèse s’intéresse à la notion de généralisation, en particulier dans le cadre de la classification en apprentissage automatique de manière supervisée. Cette approche consiste à apprendre à résoudre une tâche (classification) à partir de données d’entrainement étiquetées. La généralisation est définie comme la capacité à réaliser des prédictions correctes sur des données non observées pendant l’entraînement. Cette notion est généralement restreinte à des données qui correspondent au même domaine que celui de la tâche d’entrainement. Cependant, une littérature récente met en exergue la capacité des architectures d’apprentissage profond à généraliser en dehors de leur tâche d’entrainement. Ainsi, un modèle entrainé sur une tâche particulière peut être réutilisée en partie sur d’autres tâches. Ainsi, nous explorons différentes extensions possibles de la généralisation : apprentissage sur un ensemble de classe et l’habilité à généraliser sur un ensemble de classes plus grands, l’apprentissage sur des labels grossiers pour prédire des labels plus complexes, l’apprentissage sur une tâche artificiellement complexe pour améliorer la généralisation ou encore l’apprentissage d’opérateurs invariants pour résoudre une tâche spécifique.