Segmentation thématique de texte linéaire et non-supervisée : détection active et passive des frontières thématiques en Français

par Alexandre Labadié

Thèse de doctorat en Informatique

Sous la direction de Violaine Prince et de Marc El-Bèze.

Soutenue en 2008

à Montpellier 2 .


  • Résumé

    Ce travail s'inscrit dans le domaine du traitement automatique du langage naturel et traite plus spécifiquement de l'application de ce dernier à la segmentation thématique de texte. L'originalité de cette thèse consiste à intégrer dans une méthode non-supervisée de segmentation thématique de texte de l'information syntaxique, sémantique et stylistique. Ce travail propose une approche linéaire de la segmentation thématique s'appuyant sur une représentation vectorielle issue de l'analyse morpho-syntaxique et sémantique de la phrase. Cette représentation est ensuite utilisée pour calculer des distances entre segments thématiques potentiels en intégrant de l'information stylistique. Ce travail a donné lieu au développement d'une application qui permet de tester les différents paramètre de notre modèle, mais qui propose également d'autres approches testées dans ce travail. Notre modèle a été évaluer de deux manière différente, une évaluation automatique sur la base de textes annotés et une évaluation manuelle. Notre évaluation manuelle a donné lieu à la définition d'un protocole d'évaluation s'appuyant sur des critères précis. Dans les deux cas, les résultats de notre évaluation ont été au niveau, voir même au dessus, des performances des algorithmes les plus populaires de la littérature

  • Titre traduit

    Unsupervised Linear Topic Text Segmentation : Active and passive detection of topic boundaries in French


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (XVI-165 p.)
  • Annexes : Bibliogr. p. 159-165. Annexes

Où se trouve cette thèse ?

  • Bibliothèque : Bibliothèque interuniversitaire. Section Sciences.
  • Disponible pour le PEB
  • Cote : TS 2008.MON-159
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.