Extraction automatique de segments textuels, détection de rôles, de sujets et de polarités

par Rémi Lavalley

Thèse de doctorat en Informatique

Sous la direction de Marc El-Bèze et de Patrice Bellot.

Soutenue le 09-07-2012

à Avignon , dans le cadre de École doctorale 536 « Sciences et agrosciences » (Avignon) .

Le président du jury était Jacques Savoy.

Le jury était composé de Mathieu Roche, Chloé Clavel.

Les rapporteurs étaient Jacques Savoy, Horacio Saggion.


  • Résumé

    Dans cette thèse, nous présentons de nouvelles méthodes permettant l’extraction de chaînes de mots (segments textuels) relatives à des catégories (thématiques, rôles des locuteurs, opinions). Nous proposons, dans un premier temps, une méthode basée su rune métrique de recherche de collocations, que nous appliquons de manière distincte sur les documents liés à la même catégorie et qui, par itérations, nous permet d’obtenir des chaînes caractéristiques de cette catégorie. Ces chaînes sont alors employées pour améliorer les performances de systèmes de catégorisation de textes ou dans un but d’extraction de connaissances (faire ressortir des éléments textuels tels que des expressions employées par un type de locuteurs, des sous-thématiques liées à la catégorie,...). Nous proposons ensuite une seconde méthode permettant de rechercher, dans un corpus d’opinions, des n-grammes exprimant des jugements sur des sujets prédéfinis.Nous pouvons alors extraire des segments textuels représentant l’expression d’une opinion sur un des sujets cibles.Ces méthodes sont validées par un certain nombre d’expériences effectuées dans des contextes différents : écrits de blogs, transcriptions manuelles de parole spontanée,critiques de produits culturels, enquêtes de satisfaction EDF, en français ou en anglais, ...

    mots clés mots clés

  • NC
  • Titre traduit

    non communiqué


  • Résumé

    Non communiqué


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université d'Avignon et des Pays de Vaucluse. Service commun de la documentation. Bibliothèque numérique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.