Extraction automatisée de modèle de situation de crise à partir de données issues de réseaux sociaux

par Julien Coche

Projet de thèse en Informatique et Génie Industriel

Sous la direction de Frédérick Benaben.

Thèses en préparation à l'Ecole nationale des Mines d'Albi-Carmaux , dans le cadre de SYSTEMES , en partenariat avec CGI - Centre de Génie Industriel (laboratoire) depuis le 01-09-2018 .


  • Résumé

    En gestion de crise, comprendre rapidement ce qui se passe sur le terrain est crucial pour les acteurs de la réponse, afin de prendre des mesures pertinentes. La rapidité avec laquelle les données arrivent du terrain sur les réseaux sociaux, en particulier Twitter, n'est plus à prouver. Cependant, le déluge de données est hétérogène par bien des aspects (emplacement géographique, confiance, contenu, vocabulaire, etc), et extraire un modèle de situation demeure laborieux, encore de nos jours. En outre, en fonction des données extraites, les tweets doivent être traités un à un (par exemple pour trouver des victimes), ou comme un ensemble de tweets (par exemple pour détecter l'occurrence d'un événement). Ainsi, cette thèse s'intéresse à la mise en place d'algorithmes d'apprentissage automatique permettant d'automatiser le traitement de tweets pour inférer des instances de concepts généralement utilisés dans la description de situations de crise, de la façon la plus rapide et la plus exhaustive possible.

  • Titre traduit

    Automated extraction of crisis situation models based on social media data


  • Résumé

    During a crisis, being able to understand quickly the situation on-site is crucial for the responders to take relevant decisions together. Social media, in particular Twitter, have proved to be a means for rapidly getting information from the field. However, the deluge of data is heterogeneous in many ways (location, trust, content, vocabulary, etc), and getting a model of the crisis situation still requires laborious human actions. In addition, depending on which kind of information is mined from them, tweets have to be handle one-by-one (e.g. find victims), or as a whole - amount of tweets - (e.g. occurence of an event). Thus, this thesis aims to set up new machine learning algorithms to automate the tweets processing in order to infer instances of specific concepts that are commonly used to describe a crisis situation, in the fastest and most comprehensive way.