Impact de l'échantillonnage sur l'inférence de structures dans des réseaux. Application aux réseaux d'échanges de graines et à l'écologie

par Timothée Tabouy

Projet de thèse en Mathématiques appliquées

Sous la direction de Julien Chiquet et de Pierre Barbillon.

Thèses en préparation à Paris Saclay , dans le cadre de Mathématiques Hadamard , en partenariat avec MIA - Mathématiques et Informatique Appliquées (laboratoire) , MORSE (equipe de recherche) et de Université Paris-Sud (établissement de préparation de la thèse) depuis le 01-10-2016 .


  • Résumé

    Cette thèse vise à développer des méthodes statistiques pour l'étude d'un réseau de circulation des semences entre les agriculteurs . Le cadre statistique et de l'analyse des réseaux sociaux seront basés sur des modèles de graphes aléatoires . En effet , les graphes aléatoires sont un outil classique dans ce contexte . Plusieurs modèles spatiaux latentes ont été proposés pour décrire l'hétérogénéité des réseaux observés. Le Bloc Modèle Stochastique ( SBM ) est l'un des plus fréquemment utilisés . Dans le cas particulier du réseau de semences analysées par Ethnologue , le réseau est partiellement observée en raison du coût et de la façon dont les interviews sont réalisées . Il est nécessaire de développer une méthodologie statistique d'inférence de prendre en compte cet échantillonnage partiel.

  • Titre traduit

    Sampling impact on inference structures in networks. Application to the seed exchange networks and ecology


  • Résumé

    This thesis aims to develop statistical methods for studying a seed circulation network between farmers. The statistical framework and social network analysis will be based on random graph models . Indeed, random graphs are a classical tool in this context. Several latent space models have been proposed to describe the heterogeneity of observed networks. The Stochastic Block Model (SBM) is one of the most frequently used. In the particular case of the seed network analyzed by ethnologist, the network is partially observed because of the cost and the way that interviews are conducted. There is a need to develop an inference statistical methodology to take into account this partial sampling.