Statistical Learning of Collections of Networks with Applications in Ecology and Sociology - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2022

Statistical Learning of Collections of Networks with Applications in Ecology and Sociology

Apprentissage statistique de collections de réseaux avec applications en écologie et en sociologie

Résumé

This thesis deals with the development of statistical methods for the analysis of collections of interaction networks through three original contributions. Interaction networks are a natural way to represent in graph form the exchanges or relationships existing between a set of nodes representing species or individuals. Considering collections of networks allows to study heterogeneous systems, composed of several kinds of interactions involving different types of nodes. When the different networks of the collection are linked by a hierarchical relationship, we speak of multilevel networks. The stochastic block model has proven its relevance to model the heterogeneity of the behavior of nodes in a single network. Extensions to collections of networks and to multilevel networks are proposed. They allow to obtain a clustering of the nodes of the networks according to their role in the ecosystem or social system, and to summarize the structure of the system at the mesoscopic scale through a small number of parameters. The inference of these models is complex and variational methods are adapted for this purpose. Model selection methods are also used to determine the dependence between levels for multilevel networks and the similarity between structures for collections of networks.A last part of this thesis proposes a new method to study the robustness of ecological interaction networks. Each network is modeled by a probabilistic model whose parameters represent the network structure. This allows to make the link between the structure of the ecosystem and its robustness, but also to compare the robustness of a collection of networks and to correct the robustness of a network whose sampling would be incomplete.The developed methods are implemented in R packages and applied on data from social sciences and ecology.
Cette thèse porte sur le développement de méthodes statistiques pour l'analyse de collections de réseaux d'interactions à travers trois contributions originales. Les réseaux d'interactions constituent une façon naturelle de représenter sous forme de graphe les échanges ou relations existant entre un ensemble de noeuds représentant des espèces ou des individus. Considérer des collections de réseaux permet d’étudier des systèmes hétérogènes, composés de plusieurs sortes d’interactions impliquant différents types de n{oe}uds. Lorsque les différents réseaux de la collection sont liés par une relation hiérarchique, nous parlerons de réseaux multiniveaux. Le modèle à blocs stochastiques a prouvé sa pertinence pour modéliser l’hétérogénéité du comportement des noeuds dans un unique réseau. Des extensions aux collections de réseaux et aux réseaux multiniveaux sont proposées. Elles permettent d'obtenir un clustering des noeuds des réseaux en fonction de leur rôle dans l’écosystème ou le système social, et de résumer la structure du système à l’échelle mésoscopique à travers un faible nombre de paramètres. L’inférence de ces modèles est complexe et des méthodes variationnelles sont adaptées à cette fin. Des méthodes de sélection de modèles permettent également de déterminer la dépendance entre les niveaux pour les réseaux multiniveaux et la similarité entre les structures pour les collections de réseaux.Une dernière partie de cette thèse propose une nouvelle méthode pour étudier la robustesse de réseaux d’interactions écologiques. Chaque réseau est modélisé par un modèle probabiliste dont les paramètres représentent la structure du réseau. Cela permet de faire le lien entre la structure de l’écosystème et sa robustesse, mais aussi de comparer les robustesses d’une collection de réseaux et de corriger la robustesse d’un réseau dont l'échantillonage serait incomplet.Les méthodes développées sont implémentées dans des packages R et appliquées sur des données issues des sciences sociales et de l’écologie.
Fichier principal
Vignette du fichier
100438_CHABERT-LIDDELL_2022_archivage.pdf (16.23 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03634002 , version 1 (07-04-2022)

Identifiants

  • HAL Id : tel-03634002 , version 1

Citer

Saint-Clair Chabert-Liddell. Statistical Learning of Collections of Networks with Applications in Ecology and Sociology. Applications [stat.AP]. Université Paris-Saclay, 2022. English. ⟨NNT : 2022UPASM005⟩. ⟨tel-03634002⟩
197 Consultations
66 Téléchargements

Partager

Gmail Facebook X LinkedIn More