Quand les forêts aléatoires rencontrent les réseaux de neurones : une analyse à échantillon fini
Auteur / Autrice : | Ludovic Arnould |
Direction : | Gérard Biau, Claire Boyer, Erwan Scornet |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques |
Date : | Soutenance le 20/10/2023 |
Etablissement(s) : | Sorbonne université |
Ecole(s) doctorale(s) : | École doctorale Sciences mathématiques de Paris centre (Paris ; 2000-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de probabilités, statistique et modélisation (Paris ; 2018-....) |
Jury : | Président / Présidente : Sylvain Le Corff |
Examinateurs / Examinatrices : Gilles Louppe, Florence d' Alché-Buc | |
Rapporteurs / Rapporteuses : Sylvain Arlot, Jason Klusowski |
Mots clés
Résumé
En substance, ce doctorat vise à explorer les intersections entre des méthodes basées sur des arbres de décisions et des architectures neuronales, recherchant les synergies potentielles, les avantages et les fondements théoriques d'un point de vue statistique. Le cadre théorique est généralement celui de la régression non paramétrique à échantillons finis. Deux travaux (Chapitres 2 et 3) se concentrent sur l'algorithme Deep Forest (DF, Zhou et al. 2017), qui superpose des Random Forests (RF) à la manière d'un réseau neuronal (NN). Dans un premier temps nous analysons théoriquement l'avantage d'empiler des arbres dans une architecture DF simplifiée (Chapitre 2), et dans un second temps, nous utilisons une DF ainsi que d'autres méthodes d'arbres pré-entraînées, afin d'initialiser un NN et ainsi améliorer ses performances (Chapitre 3). Dans un développement ultérieur, nous examinons le comportement des RF dans le régime d'interpolation, élargissant ainsi l'étude des estimateurs interpolants (tels que les réseaux neuronaux et les méthodes de noyau) aux forêts aléatoires. Les taux de convergence sont établis pour l'interpolation médiane RF, et l'influence de l'interpolation sur les performances de prédiction est également mesurée par le volume de la zone d'interpolation, caractérisée pour les forêts de Breiman (Chapitre 4). Enfin, nous présentons un travail en cours de mise en oeuvre consistant à entraîner des réseaux neuronaux avec différents objectifs inspirés du PAC-Bayes afin d'atteindre une optimisation plus rapide et de meilleures performances de généralisation.