Réseaux de neurones sur graphes : analyse et contributions

par Guillaume Renton

Thèse de doctorat en Informatique

Sous la direction de Sébastien Adam.


  • Résumé

    Bien que théorisés il y a une quinzaine d’années, l’intérêt de la communauté scientifique pour les réseaux de neurones sur graphes n’a connu un réel essor que très récemment. De tels modèles visent à transposer les capacités d’apprentissage de représentation inhérentes aux réseaux de neurones profonds sur des données de type graphes, via l’apprentissage d’états cachés associés aux nœuds du graphe. Ces états cachés sont calculés et mis à jour en fonction des informations contenues dans le voisinage de chacun des nœuds. Ce récent intérêt pour les réseaux de neurones sur graphes (GNN) a conduit à une "jungle" de modèles et de méthodes, rendant le domaine de recherche parfois confus. Historiquement, deux principales stratégies ont été explorées : les réseaux spatiaux et les réseaux spectraux. Les réseaux spatiaux, parfois appelés "message passing neural network", sont basés sur le calcul d’un message agrégeant l’information contenue dans le voisinage de chacun des nœuds. Ce message est ensuite utilisé afin de mettre à jour les états cachés des différents nœuds du graphe. Les réseaux spectraux quant à eux sont basés sur la théorie spectrale des graphes et reposent donc sur le Laplacien du graphe. La décomposition en valeurs/vecteurs propres du Laplacien permet notamment de définir une transformée de Fourier sur graphe ainsi qu’une transformée inverse. À partir de ces transformées, différents filtrages peuvent être appliqués sur le graphe, obtenant des résultats similaires au filtrage sur une image ou sur un signal. Dans cette thèse, nous commençons par introduire une troisième catégorie, appelée spectral-rooted spatial convolution. En effet, certaines méthodes récentes prennent racine dans le domaine spectral tout en évitant le calcul de la décomposition en vecteurs propres du Laplacien. Cette troisième catégorie nous amène à nous poser la question de la différence fondamentale entre les réseaux de neurones spatiaux et réseaux de neurones spectraux. Nous répondons à cette question par la proposition d’un modèle général unifiant les deux stratégies, montrant notamment que les modèles spectraux sont un cas particulier des modèles spatiaux. Ce cadre unifié nous a par ailleurs permis de proposer une analyse spectrale de plusieurs modèles de GNN populaires dans la communauté scientifique, à savoir GCN, GIN, GAT, Chebnet et CayleyNet. Cette analyse montre que les modèles spatiaux sont limités aux filtrages passe-bas et passe haut, tandis que les modèles spectraux sont capables de réaliser n’importe quel type de filtres. Ces résultats sont ensuite retrouvés avec la présentation d’un problème jouet, montrant dans un premier temps la limitation des modèles spatiaux à définir des filtres passe-bande et l’importance que peut revêtir l’utilisation de tels filtres.Ces résultats nous ont amenés à proposer une méthode capable de réaliser n’importe quel type de filtrage, tout en limitant le nombre de paramètres du réseau. En effet, bien que les modèles spectraux soient capables de réaliser tout type de filtrage, l’ajout d’un nouveau filtre requiert l’ajout d’une nouvelle matrice de poids dans le réseau de neurones. Afin de réduire le nombre de paramètres, nous proposons l’adaptation des Depthwise Separable Convolution aux graphes via une méthode intitulée Depthwise Separable Graph Convolution Network. Cette méthode a été évaluée à la fois en apprentissage transductif et en apprentissage inductif, et obtient des résultats supérieurs à l’état de l’art sur les datasets testés. Enfin, nous proposons une méthode définie dans le domaine spatial afin de prendre en compte les attributs d’arcs. En effet, cette problématique a été peu étudiée par la communauté scientifique, et le nombre de méthodes proposant d’inclure ces informations est très réduit.

  • Titre traduit

    Analyzing and improving graph neural networks


  • Résumé

    Although theorised about fifteen years ago, the scientific community’s interest for graph neural networks has only really taken off recently. Those models aim to transpose the representation learning capacity inherent in deep neural network onto graph data, via the learning of hidden states associated with the graph nodes. These hidden states are computed and updated according to the information contained in the neighborhoud of each node.This recent interest for graph neural networks (GNNs) has led to a "jungle" of models and frameworks, making this field of research sometimes confusing. Historically, two main strategies have been explored : the spatial GNNs on one side and the spectral GNNs on the other side. Spatial GNNs, sometimes also called Message Passing Neural Network, are based on the computation of a message which agregates the information contained in the neighborhoud of each node. On the other side, spectral GNNs are based on the spectral graph theory and thus on the graph Laplacian. The eigendecomposition of the graph Laplacian allows to define a graph Fourier transform and its inverse. From these transforms, different filters can be applied on the graph, leading to similar result than filtering on images or signals. In this thesis, we begin by introducing a third category, called spectral rooted spatial convolution. Indeed, some recent methods are taking root in the spectral domain while avoiding to compute the eigendecomposition of the graph Laplacian. This third category leads to question about the fundamental difference between spectral and spatial GNNs. We answer this question by proposing a general model unifying both strategies, showing notably that spectral GNNs are a particular case of spatial GNNs. This unified model also allowed us to propose a spectral analysis of some popular GNNs in the scientificcommunitic, namely GCN, GIN, GAT, ChebNet and CayleyNet. This analysis shows that spatial models are limited to low-pass and high-pass filtering, while spectral models can produce any kind of filters. Those results are then found with the presentation of a toy problem, showing in the first instance the limitation of spatial models to define pass-band filters, and the importance of designing such filters. Those results have led us to propose a method allowing any kind of filter, while limiting the network’s number of parameters. Indeed, even though spectral models are able to design any kind of filtering, each new filter require the add of a new weight matrix in the neural network. In order to reduce the number of parameters, we propose to adapt Depthwise Separable Convolution to graphs through a method called Depthwise Separable Graph Convolution Network. This method is evaluated on both transductive and inductive learning, outperforming state-of-the-arts results.Finally, we propose a method defined in the spatial domain in order to take into account edge attributes. Indeed, this issue has been little studied by the scientific community, and the number of methods allowing to include edge attributes is very small. Our proposal, called Edge Embedding Graph Neural Network, consists in embedding edge attributes into a new space through a first neural network, before using the extracted features in a GNN. This method is evaluated on a particular problem of symbol detection in a graph.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Rouen. BU Lettres, Sciences humaines. Service commun de la documentation.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.