Maximization d' Influence avec l' Apprentissage Renforcee dans Reseaux Sociaux

par Georgios Panagopoulos

Projet de thèse en Informatique, données, IA

Sous la direction de Michalis Vazirgiannis et de Fragkiskos Malliaros.

Thèses en préparation à l'Institut polytechnique de Paris , dans le cadre de École doctorale de l'Institut polytechnique de Paris , en partenariat avec LIX - Laboratoire d'informatique (laboratoire) et de DaScim- Data Science and Mining Team (equipe de recherche) depuis le 01-01-2019 .


  • Résumé

    La publicité sociale s'est récemment imposée comme une composante clé de l'économie i, car elle est à l'origine d'une part importante du comportement des consommateurs. Qu'il s'agisse d'articles d'Instagram, de messages Facebook ou de tweets, les réseaux sociaux sont apparus comme un moyen efficace de diffuser des nouvelles, d'établir des tendances ou même de mener des campagnes politiques. Alors que la contagion en ligne gagne du terrain dans la formation de l'opinion publique, les plates-formes sociales offrent aux entreprises un terrain fertile pour promouvoir leurs produits en engageant des utilisateurs influents pour les faire connaître. Bien sûr, la valeur réelle du produit joue un rôle important dans le succès de la campagne, mais on pourrait soutenir que le placement stratégique est tout aussi vital. Il n'est pas surprenant que le marketing viral soit appelé à jouer un rôle crucial dans la publicité dans les années à venir. Cela dit, l'analyse de l'influence sociale, qui est au cœur du marketing viral, n'est nullement un problème résolu. Au contraire, compte tenu de la croissance exponentielle des données sociales et de la montée constante des nouvelles méthodes de surveillance complémentaires, le besoin d'algorithmes efficaces et efficients est plus que jamais d'actualité. Dans ce doctorat, nous prévoyons d'aborder des questions ouvertes concernant l'analyse de l'influence dans les réseaux sociaux, en nous concentrant sur des approches qui établissent un équilibre entre l'efficacité algorithmique et la précision des données. Plus précisément, notre étude repose sur trois piliers centraux qui interagissent les uns avec les autres : Estimation de l'influence : Estimation de l'influence qu'un utilisateur exerce sur un autre utilisateur. Analyse de l'influenceur : Analyser la connectivité temporelle des influenceurs et les modèles de diffusion de l'information afin de prédire leur évolution. Maximisation de l'influence : Identifier l'ensemble des utilisateurs qui peuvent maximiser la visibilité d'un produit par diffusion dans le réseau. Pour la première branche, nous visons à capitaliser sur les progrès récents de l'apprentissage machine pour concevoir des modèles qui peuvent tirer des enseignements efficaces de la combinaison des informations contenues à la fois dans le réseau et dans les cascades de diffusion. Pour le second, nous prévoyons effectuer des analyses exploratoires de l'activité de l'influenceur afin d'identifier les modèles spatio-temporels qui pourraient fournir l'intuition derrière la montée d'un influenceur, et essayer de la condenser dans des mesures scientifiques du réseau. La troisième s'articule autour de l'établissement d'un pont entre les travaux algorithmiques de pointe et les méthodes axées sur les données afin d'obtenir un algorithme efficace et efficient pour choisir l'ensemble des utilisateurs sources qui peuvent maximiser la diffusion de l'information dans un réseau. L'objectif final est de proposer une méthodologie novatrice qui offre une base unifiée solide aux spécialistes du marketing pour former des stratégies de publicité sociale en ligne, en fonction du type de données à leur disposition.

  • Titre traduit

    Influence Maximization with Reinforcement Learning in Social Networks


  • Résumé

    Social advertising has recently emerged as a key component of today's economy, driving a substantial portion of consumer activity. From Instagram stories to Facebook posts and tweets, social media have arisen as a defacto way to spread news, establish trends or even run political campaigns. As online contagion gains ground in shaping public opinions, social platforms provide fertile soil for companies to promote their products by hiring influential users to popularize it. Of course, the actual value of the product plays an important role in the campaign's success, but one could argue that strategic placement is just as vital. It is no surprise that viral marketing is projected to play a crucial role in advertising in the years to come. That said, the analysis of social influence, which is the heart of viral marketing, is by no means a closed problem. On the contrary, apropos of the exponential social data growth and the constant rise of novel complementary monitoring methods, the need for effective and efficient algorithms is as timely as ever. In this Ph.D., we plan to address specific open questions regarding influence analysis in social networks, focusing on approaches that strike a balance between algorithmic efficiency and data-driven accuracy. More specifically, our study stands on three central pillars which interplay with each other: Influence estimation: Estimating the influence that a user exerts on another user. Influencer analysis: Analyzing influencers' temporal connectivity and diffusion patterns aiming to predict their progress. Influence maximization: Identifying the set of users that can maximize the visibility of a product via diffusion through the network. For the first branch, we aim to capitalize on recent machine learning advancements to devise models that can effectively learn from the blend of the information contained in both, the network and the diffusion cascades. For the second, we plan to perform exploratory analyses of influencer activity to identify spatiotemporal patterns that could provide intuition behind the rise of an influencer, and try to condense it in network scientific metrics. The third revolves around bridging the state of the art algorithmic works with data-driven methods to derive a practically effective and efficient algorithm to choose the set of seed users that can maximize the spreading of information in a network. The final, complete goal is t come up with a novel methodology that provides a solid unified basis for marketers to form strategies for online social advertising, depending on the type of data at their disposal.