Analyse automatique d'opinion : problématique de l'intensité et de la négation pour l'application à un corpus journalistique

par Lei Zhang

Thèse de doctorat en Informatique et applications

Sous la direction de Stéphane Ferrari.

Soutenue en 2012

à Caen .


  • Résumé

    La problématique de l’analyse d’opinion connaît un intérêt croissant depuis une quinzaine d’années. Cette problématique mène à de nombreux travaux ayant des objectifs allant de la constitution de ressources lexicales à l’identification des cibles d’une opinion. Le cadre applicatif de notre étude est l’analyse automatique d’articles de journaux pour la veille d’opinion. Ce cadre est ambitieux vis-à-vis de l’état de l’art puisque nous sommes amené à étudier un grand nombre de critères propres à l’analyse d’opinion. Nous proposons un modèle conceptuel permettant de caractériser une opinion par la polarité, l’intensité, la prototypicalité, la cible, la source, l’engagement de l’auteur, etc. En particulier, nous modélisons la négation et ses effets sur l’intensité et la polarité. En plus des cas classiques de négation, nous sommes en mesure de modéliser des effets de rhétoriques tels que l’euphémisme ou la litote, très présents dans le genre journalistique. À partir de ce modèle conceptuel, nous présentons un ensemble de choix techniques permettant de préciser les ressources et traitements nécessaires à l’automatisation. Nous mettons en œuvre deux applications (en chinois et en français) de la chaîne de traitements issue du modèle permettant de confirmer la validité du modèle conceptuel ainsi que la pertinence des résultats d'analyse.      

  • Titre traduit

    Automatic opinion analysis : issue of intensity and negation in a newspaper corpus


  • Résumé

    Since fifteen years, the interest in the field of opinion analysis has risen. This field gathers numerous studies such as lexicon constitution and detection of opinion's holder and target. Our study aims at automatic opinion analysis in news for economic intelligence. Our objective is ambitious as, beside the state of the art, we should focus on many criteria concerning opinion analysis. We propose a conceptual model allowing the characterization of opinion according to polarity, intensity, prototypicality, opinion's holder and target, author's engagement, etc. We have specifically designed a model for the negation and its effects on intensity and polarity. In addition to the classical effect of negation, our model is able to manage rhetorical usages such as euphemism which is frequently used in news texts. Based on this conceptual model, we set up an operation model specifying our data and and processing. We implemented two applications, one for Chinese and one for French, which allow us to validate our conceptual model as well as to test its accuracy.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (195 p.)
  • Annexes : Bibliogr. p.189-195. Index

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Caen Normandie. Bibliothèque Rosalind Franklin (Sciences-STAPS).
  • Non disponible pour le PEB
  • Cote : TCAS-2012-58
  • Bibliothèque : Université de Caen Normandie. Bibliothèque Rosalind Franklin (Sciences-STAPS).
  • Disponible pour le PEB
  • Cote : TCAS-2012-58bis
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.