Thèse soutenue

Apprentissage sur les graphes et les hiérarchies

FR  |  
EN
Auteur / Autrice : Raquel Pereira de Almeida
Direction : Laurent AmsalegSilvio Guimarães
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 24/02/2023
Etablissement(s) : Université de Rennes (2023-....) en cotutelle avec Pontifícia universidade católica de Minas Gerais (Brésil)
Ecole(s) doctorale(s) : École doctorale Mathématiques, télécommunications, informatique, signal, systèmes, électronique (Rennes ; 2022-....)
Partenaire(s) de recherche : Laboratoire : Institut de recherche en informatique et systèmes aléatoires (Rennes) - LinkMedia
Jury : Président / Présidente : Laurent Najman
Examinateurs / Examinatrices : Yukiko Kenmochi‎, Zenilton Patrocínio
Rapporteurs / Rapporteuses : Davide Bacciu, Alexandre Falcão

Résumé

FR  |  
EN

Les hiérarchies, telles que décrites dans la morphologie mathématique, représentent des régions d'intérêt imbriquées et fournissent des mécanismes pour créer des concepts et une organisation cohérente des données. Elles facilitent l'analyse de haut niveau et la gestion de grandes quantités de données. Représentées sous forme d'arbres hiérarchiques, elles ont des formalismes croisés avec la théorie des graphes, et des applications qui peuvent être facilement généralisées. En raison des algorithmes déterministes, des représentations multiformes et distinctes, et de l'absence d'un moyen direct d'évaluer la qualité de la représentation hiérarchique, il est difficile d'insérer des informations hiérarchiques dans un cadre d'apprentissage et de bénéficier des avancées récentes dans le domaine. Les chercheurs s'attaquent généralement à ce problème en affinant les hiérarchies pour un média spécifique et en évaluant leur qualité pour une tâche particulière. L'inconvénient de cette approche est qu'elle dépend de l'application et que les formulations limitent la généralisation à des données similaires. Ce travail vise à créer un cadre d'apprentissage qui peut fonctionner avec des données hiérarchiques et qui est agnostique à l'entrée et à l’application. L'idée est d'étudier les moyens de transformer les données en une représentation régulière requise par la plupart des modèles d'apprentissage tout en préservant la richesse de l'information dans la structure hiérarchique. Il propose d'étudier et de formaliser les concepts sous forme de graphes, un point commun pour les hiérarchies et le multimédia, et un sujet de grand intérêt pour l'apprentissage automatique. Les méthodes proposées dans cette étude utilisent des graphes d'images pondérés par des arêtes et des arbres hiérarchiques comme entrée, et évaluent différentes propositions sur les tâches de détection des contours et de segmentation. Le modèle principal est la forêt aléatoire, une méthode rapide, verifiable et extensible, adaptée au travail avec des données de grandes dimensions. Malgré les médias, les tâches et les choix de modèle , il concentre les formulations sur des graphes et des arbres hiérarchiques, et n'utilise les tâches que pour évaluer la réponse produite par différentes caractéristiques. Il donne les résultats en termes quantitatifs et qualitatifs et propose des analyses statistiques de la distribution et de la dimensionnalité des données, évaluant ainsi leur impact sur l'apprentissage. En outre, il fournit une revue systématique de la littérature sur des propositions qui intègrent l'apprentissage automatique et les hiérarchies. Il démontre qu'il est possible de créer un cadre d'apprentissage dépendant uniquement des données hiérarchiques qui fonctionne dans plusieurs tâches avec différents modèles.