Reconnaissance automatique des noms propres : application à la classification automatique de textes journalistiques

par Nathalie Friburger

Thèse de doctorat en Informatique

Sous la direction de Denis Maurel.

Soutenue en 2002

à Tours .


  • Résumé

    Dans les textes journalistiques, les noms propres sont très importants pour une compréhension précise du sens des textes, mais ils sont très peu représentés dans les ressources lexicales disponibles. Le travail réalisé ici cherche à automatiser leur extraction et leur catégorisation. Nous avons implanté le système CasSys qui permet l'utilisation de cascade de transducteurs et peut ainsi réaliser de l'analyse syntaxique d'un texte ou de l'extraction d'information. Le système d'extraction de noms propres crée, extracNP, utilise casSys ; les phénomènes d'ambigui͏̈tés, de segmentation et de catégorisation des noms propres sont ainsi gérés par la cascade. Par cette méthode, nous avons obtenu une précision de 94% avec un rappel de plus de 93%. Puis, nous avons montré que les noms propres sont porteurs d'une information qui les rend particulièrement intéressants pour obtenir une classification de qualité.

  • Titre traduit

    Automatic recognition of proper names : an application in automatic clustering of journalistic texts


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 162 f.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. f. 143-152

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Tours. Service commun de la documentation. BU de Grandmont.
  • Disponible pour le PEB
  • Cote : T.S.2002-4011(1er ex.)
  • Bibliothèque : Université de Tours. Service commun de la documentation. BU de Grandmont.
  • Disponible pour le PEB
  • Cote : T.S.2002-4011(2e ex.)
  • Bibliothèque : Ecole Polytechnique de l’Université de Tours. Départements Electronique et Energie, Informatique, Mécanique et Systèmes. Centre de documentation.
  • Disponible pour le PEB
  • Cote : DI-TH-676

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Université de Lille. Service commun de la documentation. Bibliothèque universitaire de Sciences Humaines et Sociales.
  • Non disponible pour le PEB
  • Cote : 2002TOUR4011
  • Bibliothèque : Université Paris-Est Créteil Val de Marne. Service commun de la documentation. Section multidisciplinaire.
  • PEB soumis à condition
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.