Le résumé automatique des textes scientifiques et techniques : aspects linguistiques et computationnels : réalisation d'un prototype procédant par extraction de phrases du texte source : le système de Résumé Automatique à Fragments Indicateurs (RAFI)

par Abderrafih Lehmam

Thèse de doctorat en Sciences du langage

Sous la direction de Henri-Claude Grégoire.

Soutenue en 1995

à Nancy 2 .


  • Résumé

    Le résumé de texte automatique s'inscrit dans le cadre des industries de la langue. Notre travail propose un système qui transforme automatiquement un texte source brut en un texte cible plus réduit. Ce système traite uniquement les textes scientifiques et techniques. Le système est fondé sur la reconnaissance d'éléments phrastiques qui lui permet d'évaluer la pertinence de la phrase en vue d'une éventuelle sélection pour la construction du résumé. La méthode mise en œuvre cherche à donner un score a toutes les phrases du texte et ensuite à procéder à l'élimination de celles ayant obtenu les scores les plus bas et de celles ayant réalisé un score nul. Nous avons fait appel, pour la réalisation du système RAFI (résumé automatique à fragments indicateurs), aux moyens linguistiques d'analyse du discours et aux capacités de calcul des outils informatiques.

  • Titre traduit

    Automatic summary of scientific and technical texts : linguistic and computational aspects : production of a prototype based on extraction of sentences from original text : the RAFI system


  • Résumé

    The automatic text summary concerns the language. This thesis proposes a system automatically and directly transforming a source text into a reduced target text. It based on the identification of specific expressions allowing an evaluation of the relevance of the sentence concerned, which can then be selected for the elaboration of the summary. The procedure consists in attributing a score to each sentence of the text and then eliminating those having the lowest score. To produce RAFI (automatic summary based on indicative fragments) we resorted to the linguistic means of discourse analysis and the computing capacity of data processing instruments.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (316 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 231-257.

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Lorraine. Direction de la Documentation. Bibliothèque universitaire Lettres et sciences humaines.
  • Consultable sur place dans l'établissement demandeur
  • Cote : LN 95/21
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.