Thèse soutenue

Exploring human interactions for influence modeling in online social networks

FR  |  
EN
Auteur / Autrice : Monika Rakoczy
Direction : Amel Bouzeghoub
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 07/06/2019
Etablissement(s) : Université Paris-Saclay (ComUE)
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Télécom SudParis (France) - Département Informatique / INF - Services répartis, Architectures, MOdélisation, Validation, Administration des Réseaux
établissement opérateur d'inscription : Institut national des télécommunications (Evry ; 1979-2009)
Equipe de recherche : Algorithmes, Composants, Modèles Et Services pour l'informatique répartie / ACMES-SAMOVAR
Jury : Président / Présidente : Bogdan Cautis
Examinateurs / Examinatrices : Katarzyna M. Węgrzyn-Wolska, Cédric Du Mouza, Salima Benbernou
Rapporteurs / Rapporteuses : Lynda Tamine-Lechani, Przemysław Kazienko

Résumé

FR  |  
EN

De nos jours, la popularité des réseaux sociaux (RS) est en constante progression. En effet, de plus en plus d’utilisateurs interagissent dans le monde virtuel, soit en y exprimant des opinions, en partageant des expériences, en réagissant aux avis d’autrui ou encore en échangeant des idées, en fonction de leurs qualités : influents, populaires, dignes de confiance, etc.. Dans la littérature, l’influence a fait l'objet d'une attention particulière ces dernières années. En effet, de nombreux domaines, dont l’Analyse des Réseaux Sociaux (ARS) et les systèmes de recommandation ont étudié l’influence, sa détection, la propagation de son effet et sa mesure. Ainsi, des modèles d'identification et d'estimation de l'influence sont aujourd'hui largement utilisés dans de nombreuses applications dédiées au marketing, aux campagnes politiques/sociales, etc. De plus, les interactions entre utilisateurs indiquent non seulement l’influence mais aussi la confiance, la popularité ou la réputation. Cependant, ces notions sont encore vaguement définies et il n'existe pas de consensus dans la communauté ARS. Définir, distinguer et mesurer la force de ces relations entre les utilisateurs posent également de nombreux défis, à la fois théoriques et pratiques, qui restent à explorer. La modélisation de l’influence pose de multiples défis et les méthodes actuelles de découverte et d’évaluation n’explorent pas encore pleinement les différents types d’interactions et ne sont en général pas applicables à plusieurs RS. En outre, la prise en compte de la dimension temporelle dans le modèle d’influence est importante, difficile et nécessite un examen plus approfondi. Enfin, l’exploration de liens possibles entre des notions, telles que l’influence et la réputation, reste un sujet ouvert. Dans cette thèse, nous nous focalisons sur les quatre concepts qualifiant les utilisateurs : influence, réputation, confiance et popularité, pour la modélisation de l'influence. Nous analysons les travaux existants utilisant ces notions et comparons leurs différentes interprétations. Par cette analyse, nous mettons en avant les caractéristiques essentielles que ces concepts devraient inclure, et nous en effectuons une analyse comparative. Cela nous permet d'établir une classification globale des différentes interprétations des notions selon leur niveau d'abstraction et leurs divergences ; cela constitue la première, contribution de cette thèse. En conséquence, nous proposons un modèle théorique de l'influence ainsi qu'une ontologie associée décrivant ce concept. Nous présentons également une variante de l'influence, inexplorée à ce jour dans le domaine de l’ARS, la micro-influence. Celle-ci cible un phénomène nouveau dans les RS que sont les utilisateurs avec une faible audience, mais fortement impliqués ; ces derniers apparaissent en effet comme ayant un impact fort malgré tout. En s'appuyant sur ces définitions, nous proposons ensuite un modèle pratique dénommé ARIM (Action-Reaction Influence Model). Ce modèle considère le type, la qualité, la quantité et la fréquence des actions réalisées par les utilisateurs, et ce en étant compatible avec différents RS. Nous abordons également la quantification de l'influence au cours du temps et la représentation de ses effets de causalité. Pour cela, nous considérons un type spécifique de RS: les réseaux de citations, particulièrement sensibles au temps. Ainsi, nous proposons un modèle, TiDIE (Time Dependent Influence Estimation), qui détermine l'influence, sur une période de temps, entre les communautés de ces réseaux. Enfin, nous combinons l’influence et la réputation avec le modèle TiDIE, afin d’étudier les dépendances entre elles. Nous proposons une méthode de transition, ReTiDIE, utilisant l’influence pour obtenir la réputation. Pour chacune de nos approches, des expérimentations ont été menées sur des jeux de données réels et ont montré la pertinence de nos méthodes