Système de recommandation sur les plateformes de micro-blogging et bulles filtrantes

par Quentin Grossetti

Thèse de doctorat en Informatique

Le président du jury était Bernd Amann.

Le jury était composé de Christian Dan Vodislav, Luc Bouganim.

Les rapporteurs étaient Sihem Amer-Yahia, Bogdan Cautis.


  • Résumé

    Avec la croissance sans précédent des publications sur les plateformes de micro-blogging, trouver du contenu intéressant pour un utilisateur est devenu un enjeu majeur. Cependant, en raison des propriétés intrinsèques des plateformes de micro–blogging, comme le flux gigantesque de messages arrivant tous les jours et leur faible durée de vie, il est difficile d’appliquer les méthodes traditionnelles de recommandation comme la factorisation matricielle. Après une étude approfondie d’un large jeu de donnée issu de Twitter, nous présentons un modèle de propagation qui repose sur l’homophilie présente dans le réseau pour recommander des messages aux utilisateurs. Notre approche s’appuie sur la construction d’un graphe de similarités lié aux interactions des utilisateurs. Nous présentons plusieurs expérimentations pour démontrer la qualité de prédiction de notre modèle et sa capacité à passer à l’échelle. Enfin, nous évaluons différents algorithmes de détections de communautés, qui permettent d’évaluer l’impact des systèmes de recommandations sur l’isolement communautaire des utilisateurs. Nous proposons une métrique permettant de quantifier la force des bulles filtrantes et nos résultats montrent que cet effet de bulle filtrante est en réalité limité pour une majorité d’utilisateurs. Il semble que, de façon contre intuitive, dans la majorité des cas les systèmes de recommandation ouvrent les perspectives des utilisateurs. Cependant, une minorité de personnes est concerné par l’effet de bulle et nous proposons donc un modèle reposant sur les liens entre communautés pour adapter les recommandations afin d’être plus en accord avec leur profil communautaire.

  • Titre traduit

    Recommender system on microblogging plateforms and filter bubbles


  • Résumé

    With the unprecedented growth of user-generated content produced on microblogging platforms, finding interesting content for a given user has become a major issue. However due to the intrinsic properties of microblogging systems, such as the volumetry, the short lifetime of posts and the sparsity of interactions between users and content, recommender systems cannot rely on traditional methods, such as collaborative filtering matrix factorization. After a thorough study of a large Twitter dataset, we present a propagation model which relies on homophily to propose post recommendations. Our approach relies on the construction of a similarity graph based on retweet behaviors on top of the Twitter graph. We then conduct experiments on our real dataset to demonstrate the quality and scalability of our method. Finally, we investigate community detection algorithms and we present a metric to compute the strength of the filter bubble. Our results show that filter bubble effects are in fact limited for a majority of users. We find that, counter-intuitively, in most cases recommender systems tend to open users perspectives. However, for some specific users, the bubble effect is noticeable and we propose a model relying on communities to provide a list of recommendations closer to the user’s usage of the platform.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Sorbonne Université. Bibliothèque des thèses électroniques.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.