Thèse soutenue

Embedding de graphes temporels : temporalisation de méthodes statiques et alignement

FR  |  
EN
Auteur / Autrice : Mounir Haddad
Direction : Philippe Lenca
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 24/02/2022
Etablissement(s) : Ecole nationale supérieure Mines-Télécom Atlantique Bretagne Pays de la Loire
Ecole(s) doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : Laboratoire : Equipe DECIDE - Département Logique des Usages, Sciences sociales et Sciences de l'Information - Laboratoire en sciences et techniques de l'information, de la communication et de la connaissance (Brest ; 2012-....)
Jury : Président / Présidente : Hocine Cherifi
Examinateurs / Examinatrices : Philippe Lenca, Christine Largeron, Hamida Seba Lagraa, Nicolas Dugué, Cécile Bothorel
Rapporteurs / Rapporteuses : Christine Largeron, Hamida Seba Lagraa

Résumé

FR  |  
EN

La dernière décennie a vu émerger des travaux couvrant un large spectre des branches du traitement de la donnée ayant pour objectif l'apprentissage de représentation de données (data embedding plus communément) : il s'agit d'un prétraitement qui s'attache à représenter les données sous forme de vecteurs dans un espace latent à faible dimension. Cette technique a été adaptée à plusieurs types de données, entre autres aux graphes issus des réseaux sociaux. Néanmoins, bien que fondamentale, la dimension temporelle des graphes reste sous-explorée par l’état de l’art des méthodes d’embedding. Ce travail de thèse s’est attaché à l’étude du cas de l’embedding de graphes temporels. Un premier axe a consisté en la conception de méthodes d’embedding temporelles : dans un premier temps, une méthode ''exhaustive'', puis une autre méthode couplant la notion des marches aléatoires à un mécanisme de lissage temporel entre vecteurs d’embedding consécutifs. Aussi, nous avons conçu une variante ''task-specific'' utilisant en partie les labels des nœuds en entrée pour améliorer les tâches de classification. Dans le second volet du travail de thèse, nous avons conçu une approche générique de ''temporalisation'' d'une catégorie de méthodes d'embedding statiques (les autoencodeurs), améliorant significativement les performances des tâches d'inférence sensibles à la dimension temporelle. Enfin, le dernier axe a été consacré à l’étude de l’alignement temporel des embeddings, i.e.les potentiels décalages entre les espaces d'embedding des différents pas de temps, et à son impact sur la consistance des représentations latentes apprises.