Propagation du buzz sur Internet -- Identification, analyse, modélisation et représentation dans un contexte de veille

par Aurélien Lauf

Thèse de doctorat en Traitement automatique des langues

Sous la direction de Mathieu Valette.

Soutenue le 14-10-2014

à Paris, INALCO , dans le cadre de École doctorale Langues, littératures et sociétés du monde (Paris) , en partenariat avec Équipe de Recherche en Textes- Informatique- Multilinguisme / ERTIM (laboratoire) .


  • Résumé

    S’inscrivant dans un contexte de veille et d’intelligence d’entreprise sur Internet, l’objectif de cette thèse est d’élaborer des outils et des méthodes permettant d’identifier, analyser, modéliser et représenter le cheminement des buzz sur Internet. Tout buzz a un ou plusieurs points d’origine : les sources primaires. L’information est ensuite relayée par des sources secondaires qui vont accélérer ou non la propagation en fonction de leur degré d’influence. Tout au long du cycle de vie du buzz, le contenu sémantique est amené à évoluer. La compréhension d’un buzz sur Internet passe ainsi par l’analyse de ce qui se dit et la qualification des émetteurs. Nos travaux s’axeront donc autour de deux types d’analyses complémentaires : une analyse topologique des sources (théorie des graphes et des réseaux) et une analyse du contenu textuel (linguistique de corpus).

  • Titre traduit

    Buzz lifecyle on the Web -- Identification, analysis, modelization and representation in the context of strategic and competitive intelligence


  • Résumé

    This thesis is in the context of strategic and competitive intelligence. Its goal is to develop tools and methods to identify, analyze, model and represent how buzz spread on the Internet. Any buzz has one or more starting point(s), i.e. primary source(s). The information is then passed on by secondary sources which may speed or slow down its spreading depending on their influence. Throughout the buzz lifecycle, the semantic content can evolve. To understand a buzz on the Internet, one needs to analyze what is said and qualify who speaks. This thesis will focus on two main points : a topological analysis of the sources (graph theory and networks), and an analysis of the textual content (corpus linguistics).


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Bibliothèque universitaire des langues et civilisations (Paris).
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.