Détection des signaux faibles : application à l'analyse des opinions

par Hamid Jalalzai

Projet de thèse en Mathématiques et Informatique

Sous la direction de Chloé Clavel, Anne Sabourin et de Éric Gaussier.

Thèses en préparation à Paris Saclay , dans le cadre de École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....) , en partenariat avec LTCI - Laboratoire de Traitement et Communication de l'Information (laboratoire) , S2A - Statistique et Apprentissage (equipe de recherche) et de Télécom ParisTech (établissement de préparation de la thèse) depuis le 16-10-2017 .


  • Résumé

    L'analyse des opinions dans les réseaux sociaux est un domaine de recherche en plein essor, poussé, d'une part, par les enjeux applicatifs du domaine (recommandation, e-reputation, gestion de la relation client), et, d'autre part, par la multiplication des plateformes d'expressions des citoyens et des médias sur le web. Dans ce contexte, un des enjeux majeurs est de pouvoir détecter les signaux faibles afin de prédire l'activité d'un thème donné et l'arrivée d'un buzz sur les réseaux sociaux. Plusieurs travaux ont proposé différentes approches à la détection de buzz, problématique tantôt vue comme un problème de classification, de régression ou d'apprentissage d'ordonnancement. Le point commun à toutes ces approches est bien sûr de s'appuyer sur des techniques d'apprentissage automatique, largement utilisées dans ce domaine. Toutefois, les modélisations adoptées jusqu'à présent ne tiennent pas compte du fait que la majorité des signaux présents dans les réseaux sociaux sont en fait des signaux faibles. Il n'est dès lors pas surprenant de voir que l'on prédit bien les événements fréquents (c'est-à-dire les événements faciles à prédire), et relativement mal tous les autres. L'objectif de cette thèse est de revenir sur ce problème et de proposer de nouvelles méthodes pour la prédiction de buzz qui s'appuient sur la détection de signaux faibles dans les données textuelles issues des réseaux sociaux.

  • Titre traduit

    Weak signal detection: application to opinion analysis


  • Résumé

    Opinion analysis in social media is a growing research field. One of the main challenges is to detect weak signals in order to predict the activity of a given topic and the emergence of a buzz on social networks. The underlying methods used for the buzz detection are base on machine learning approaches. However, the used models do not take into account that these signals are weak. The frequent events are thus correctly predicted, but the other events (that correspond to weak signals) are more diffuclut to predict. The aim of this thesis is to tackle this issue and to propose new methods for buzz prediction that rely on weak signal detection in textual data collected on social networks.