Application of the Google matrix methods for characterization of directed networks

par Vivek Kandiah

Thèse de doctorat en Sciences de la matière

Sous la direction de Bertrand Georgeot et de Dima Shepelyansky.

Soutenue en 2014

à Toulouse 3 .


  • Résumé

    La théorie des réseaux complexes est un domaine récent et important de la recherche qui consiste étudier divers systèmes naturels ou artificiels d'un point de vue des graphes en considérant une collection d'objets interdépendants. Parmi les différents aspects de la théorie des réseaux complexes, cette thèse se concentre sur l'analyse des propriétés structurelles des réseaux dirigés. L'outil principal utilisé dans ce travail est la méthode de la matrice Google qui est une méthode dérivée de la théorie des chaînes de Markov. La construction de cette matrice et son lien avec les chaînes de Markov sont expliqués dans le second chapitre et les propriétés spectrales des valeurs propres y sont également discutées. L'accent est mis sur le vecteur propre principal dela matrice (le PageRank). La base du système de ranking donné par le Page Rank y est expliquée en détail et illustrée à travers plusieurs exemples dans les chapitres suivants. Les systèmes considérés ici sont: les séquences d'ADN de quelques espèces animales,le système nerveux du vers C. Elegans ainsi que l'antique jeu de stratégie sur plateau, le jeu de go. Dans le premier cas nous analysons les propriétés statistiques des chaînes symboliques sous le point de vue des réseaux dirigés et nous proposons une mesure simple de similarité entre les espèces basée sur le PageRank. Dans le second cas nous introduisons le concept du ranking complémentaire (le CheiRank) permettant de caractériser en deux dimensions les réseaux dirigés. Dans le troisième cas nous utilisons les vecteurs propres principaux pour mettre en évidence les coups importants joués lors d'une partie de Go et nous montrons que les vecteurs propres suivants peuvent contenir des informations de communautés de coups. Ces diverses applications montrent que l'information apportée par le PageRank peut s'avérer utile dans de nombreuses situations différentes affin d'obtenir un aperçu du problème sous un angle différent, qui est l'approche des réseaux dirigés, enrichissant ainsi notre compréhension des systèmes étudiés.

  • Titre traduit

    Application des méthodes de la matrice google à la caractérisation des réseaux dirigés


  • Résumé

    The complex network theory is a recent field of great importance to study various systems under a graph perspective by considering a collection of interdependent objects. Among the different aspects of the complex networks, this thesis is focused on the analysis of structural properties of directed networks. The primary tool used in this work is the Google matrix method which is derived from the Markov chain theory. The construction of this matrix and its link with Markov chains are explored and the spectral properties of the eigenvalues are discussed with an emphasis on the dominant eigenvalue with its associated eigenvector(PageRank vector). The ranking system given by the PageRank is explained in detail and illustrated through several examples. The systems considered here are the DNA sequences of some animal species, the neural system of the C. Elegans worm and the ancient strategy board game : the game of Go. In the first case, the statistical properties of symbolic chains are analyzed through a directed network viewpoint and a similarity measure of species based on PageRank is proposed. In the second case, the complementary ranking system (CheiRank vector) is introduced to provide a two dimensional characterization of the directed networks. In the third case, the dominant eigenvectors are used to highlight the most important moves during a game of Go and it is shown that those eigenvectors contain more information than mere frequency counts of the moves. It is also discussed that eigenvectors other than the dominant ones might contain information about some community structures of moves. These applications show how the information brought by the PageRank can be useful in various situations to gain some interesting or original insight about the studied system and how it is helping to understand the organization of the underlying directed network.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (140 p.)
  • Annexes : Bibliogr. p. 133-140

Où se trouve cette thèse ?

  • Bibliothèque : Université Paul Sabatier. Bibliothèque universitaire de sciences.
  • Disponible pour le PEB
  • Cote : 2014 TOU3 0122
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.