Exploring human interactions for influence modeling in online social networks

par Monika Rakoczy

Thèse de doctorat en Informatique

Sous la direction de Amel Bouzeghoub.

Soutenue le 07-06-2019

à l'Université Paris-Saclay (ComUE) , dans le cadre de École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....) , en partenariat avec Télécom SudParis (France) (laboratoire) , Institut national des télécommunications (Evry) (établissement opérateur d'inscription) , Département Informatique / INF (laboratoire) , Algorithmes, Composants, Modèles Et Services pour l'informatique répartie / ACMES-SAMOVAR (équipe de recherche) et de Services répartis, Architectures, MOdélisation, Validation, Administration des Réseaux (laboratoire) .

Le président du jury était Bogdan Cautis.

Le jury était composé de Katarzyna M. Węgrzyn-Wolska, Cédric Du Mouza, Salima Benbernou.

Les rapporteurs étaient Lynda Tamine-Lechani, Przemysław Kazienko.


  • Résumé

    De nos jours, la popularité des réseaux sociaux (RS) est en constante progression. En effet, de plus en plus d’utilisateurs interagissent dans le monde virtuel, soit en y exprimant des opinions, en partageant des expériences, en réagissant aux avis d’autrui ou encore en échangeant des idées, en fonction de leurs qualités : influents, populaires, dignes de confiance, etc.. Dans la littérature, l’influence a fait l'objet d'une attention particulière ces dernières années. En effet, de nombreux domaines, dont l’Analyse des Réseaux Sociaux (ARS) et les systèmes de recommandation ont étudié l’influence, sa détection, la propagation de son effet et sa mesure. Ainsi, des modèles d'identification et d'estimation de l'influence sont aujourd'hui largement utilisés dans de nombreuses applications dédiées au marketing, aux campagnes politiques/sociales, etc. De plus, les interactions entre utilisateurs indiquent non seulement l’influence mais aussi la confiance, la popularité ou la réputation. Cependant, ces notions sont encore vaguement définies et il n'existe pas de consensus dans la communauté ARS. Définir, distinguer et mesurer la force de ces relations entre les utilisateurs posent également de nombreux défis, à la fois théoriques et pratiques, qui restent à explorer. La modélisation de l’influence pose de multiples défis et les méthodes actuelles de découverte et d’évaluation n’explorent pas encore pleinement les différents types d’interactions et ne sont en général pas applicables à plusieurs RS. En outre, la prise en compte de la dimension temporelle dans le modèle d’influence est importante, difficile et nécessite un examen plus approfondi. Enfin, l’exploration de liens possibles entre des notions, telles que l’influence et la réputation, reste un sujet ouvert. Dans cette thèse, nous nous focalisons sur les quatre concepts qualifiant les utilisateurs : influence, réputation, confiance et popularité, pour la modélisation de l'influence. Nous analysons les travaux existants utilisant ces notions et comparons leurs différentes interprétations. Par cette analyse, nous mettons en avant les caractéristiques essentielles que ces concepts devraient inclure, et nous en effectuons une analyse comparative. Cela nous permet d'établir une classification globale des différentes interprétations des notions selon leur niveau d'abstraction et leurs divergences ; cela constitue la première, contribution de cette thèse. En conséquence, nous proposons un modèle théorique de l'influence ainsi qu'une ontologie associée décrivant ce concept. Nous présentons également une variante de l'influence, inexplorée à ce jour dans le domaine de l’ARS, la micro-influence. Celle-ci cible un phénomène nouveau dans les RS que sont les utilisateurs avec une faible audience, mais fortement impliqués ; ces derniers apparaissent en effet comme ayant un impact fort malgré tout. En s'appuyant sur ces définitions, nous proposons ensuite un modèle pratique dénommé ARIM (Action-Reaction Influence Model). Ce modèle considère le type, la qualité, la quantité et la fréquence des actions réalisées par les utilisateurs, et ce en étant compatible avec différents RS. Nous abordons également la quantification de l'influence au cours du temps et la représentation de ses effets de causalité. Pour cela, nous considérons un type spécifique de RS: les réseaux de citations, particulièrement sensibles au temps. Ainsi, nous proposons un modèle, TiDIE (Time Dependent Influence Estimation), qui détermine l'influence, sur une période de temps, entre les communautés de ces réseaux. Enfin, nous combinons l’influence et la réputation avec le modèle TiDIE, afin d’étudier les dépendances entre elles. Nous proposons une méthode de transition, ReTiDIE, utilisant l’influence pour obtenir la réputation. Pour chacune de nos approches, des expérimentations ont été menées sur des jeux de données réels et ont montré la pertinence de nos méthodes

  • Titre traduit

    Exploration des interactions humaines pour la modélisation de l'influence dans les réseaux sociaux


  • Résumé

    Online social networks are constantly growing in popularity. They enable users to interact with one another and shifting their relations to the virtual world. Users utilize social media platforms as a mean for a rich variety of activities. Indeed, users are able to express their opinions, share experiences, react to other users' views and exchange ideas. Such online human interactions take place within a dynamic hierarchy where we can observe and distinguish many qualities related to relations between users, concerning influential, trusted or popular individuals. In particular, influence within Social Networks (SN) has been a recent focus in the literature. Many domains, such as recommender systems or Social Network Analysis (SNA), measure and exploit users’ influence. Therefore, models discovering and estimating influence are important for current research and are useful in various disciplines, such as marketing, political and social campaigns, recommendations and others. Interestingly, interactions between users can not only indicate influence but also involve trust, popularity or reputation of users. However, all these notions are still vaguely defined and not meeting the consensus in the SNA community. Defining, distinguishing and measuring the strength of those relations between the users are also posing numerous challenges, on theoretical and practical ground, and are yet to be explored. Modelization of influence poses multiple challenges. In particular, current state-of-the-art methods of influence discovery and evaluation still do not fully explore users’ actions of various types, and are not adaptive enough for using different SN. Furthermore, adopting the time aspect into influence model is important, challenging and in need of further examination part of the research. Finally, exploring possible connections and links between coinciding notions, like influence and reputation, remains to be performed.In this thesis, we focus on the qualities of users connected to four important concepts: influence, reputation, trust, and popularity, in the scope of SNA for influence modeling. We analyze existing works utilizing these notions and we compare and contrast their interpretations. Consequently, we emphasize the most important features that these concepts should include and we make a comparative analysis of them. Accordingly, we present a global classification of the notions concerning their abstract level and distinction of the terms from one another, which is a first and required contribution of the thesis. Consequently, we then propose a theoretical model of influence and present influence-related ontology. We also present a distinction of notion not yet explored in SNA discipline -- micro-influence, which targets new phenomena of users with a small but highly involved audience, who are observed to be still highly impactful. Basing on the definitions of the concepts, we propose a practical model, called Action-Reaction Influence Model (ARIM). This model considers type, quality, quantity, and frequency of actions performed by users in SN, and is adaptive to different SN types. We also focus on the quantification of influence over time and representation of influence causal effect. In order to do that, we focus on a particular SN with a specific characteristic - citation network. Indeed, citation networks are particularly time sensitive. Accordingly, we propose Time Dependent Influence Estimation (TiDIE), a model for determining influence during a particular time period between communities within time-dependent citation networks. Finally, we also combine two of the abovementioned notions, influence and reputation, in order to investigate the dependencies between them. In particular, we propose a transition method, ReTiDIE, that uses influence for predicting the reputation. For each of the proposed approaches, experiments have been conducted on real-world datasets and demonstrate the suitability of the methods


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Télécom SudParis et Institut Mines-Télécom Business School. Médiathèque.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.