Thèse soutenue

Prétopologie et modélisation de sujets pour l'analyse de systèmes complexes : application à la classification de documents et à l'analyse de réseaux complexes

FR  |  
EN
Auteur / Autrice : Quang Vu Bui
Direction : Marc Bui
Type : Thèse de doctorat
Discipline(s) : Informatique, statistiques et cognition
Date : Soutenance le 27/09/2018
Etablissement(s) : Paris Sciences et Lettres (ComUE)
Ecole(s) doctorale(s) : École doctorale de l'École pratique des hautes études (Paris)
Partenaire(s) de recherche : Établissement de préparation de la thèse : École pratique des hautes études (Paris ; 1868-....)
Laboratoire : Cognitions humaine et artificielle (Paris)
Jury : Président / Présidente : Charles Tijus
Examinateurs / Examinatrices : Marc Bui, Charles Tijus, Hacène Fouchal, Jean-Frédéric Myoupo, Tu Bao Ho
Rapporteurs / Rapporteuses : Hacène Fouchal, Jean-Frédéric Myoupo, Tu Bao Ho

Résumé

FR  |  
EN

Les travaux de cette thèse présentent le développement d'algorithmes de classification de documents d'une part, ou d'analyse de réseaux complexes d'autre part, en s'appuyant sur la prétopologie, une théorie qui modélise le concept de proximité. Le premier travail développe un cadre pour la classification de documents en combinant une approche de topicmodeling et la prétopologie. Notre contribution propose d'utiliser des distributions de sujets extraites à partir d'un traitement topic-modeling comme entrées pour des méthodes de classification. Dans cette approche, nous avons étudié deux aspects : déterminer une distance adaptée entre documents en étudiant la pertinence des mesures probabilistes et des mesures vectorielles, et effet réaliser des regroupements selon plusieurs critères en utilisant une pseudo-distance définie à partir de la prétopologie. Le deuxième travail introduit un cadre général de modélisation des Réseaux Complexes en développant une reformulation de la prétopologie stochastique, il propose également un modèle prétopologique de cascade d'informations comme modèle général de diffusion. De plus, nous avons proposé un modèle agent, Textual-ABM, pour analyser des réseaux complexes dynamiques associés à des informations textuelles en utilisant un modèle auteur-sujet et nous avons introduit le Textual-Homo-IC, un modèle de cascade indépendant de la ressemblance, dans lequel l'homophilie est fondée sur du contenu textuel obtenu par un topic-model.