Un modele theorique d'inference de structures semantiques et discursives dans le cadre de la generation automatique de textes

par Laurent Roussarie

Thèse de doctorat en Linguistique

Sous la direction de Laurence Danlos.

Soutenue en 2000

à Paris 7 .


  • Pas de résumé disponible.


  • Résumé

    Cette these est consacree au probleme de la structuration du discours dans la perspective de la ge♭ neration automatique de textes. De nombreux travaux abordent cette operation en montrant qu'elle doit intervenir des les premieres etapes du processus de generation. Il est courant, egalement, de constater que les modeles de structuration de discours proposes jusqu'ici tiennent pour acquise et predeterminee la notion de proposition, c'est-a-dire une classe d'objets qui sont deja de nature lin♭ guistique. Nous commencons par souligner le paradoxe que ce type d'approches peut induire : un generateur produit du texte a partir de donnees supposees independantes de la langue ; or d'une part la structuration du discours consiste habituellement a agencer des lots de propositions et d'autre part ledecoupage et le dosage de l'information dans des formes propositionnelles ressortissent deja a la mise en discours, c'est-a-dire a la mise en langue. Notre etude propose alors un modele theorique de generation profonde systematique qui, par hy♭ pothese, prend en entree des donnees codees sous forme mathematique pour les affranchir de tout prejuge linguistique. Le champ d'etude est delimite en s'appliquant au cas des recits portant sur des phenomenes spatio-temporels, et l'objectif central est de produire toutes les paraphrases discursives possibles pour relater un meme episode. Le modele consiste en un jeu d'inferences logiques qui parcourt un systeme de representations stratifie. Plusieurs ensembles de regles permettent tour a tour d'inferer d'abord des formulations logiques elementaires, puis des schemas d'evenements, puis des propositions minimales et enfin des plans de discours structures par des relations rhetoriques et qui s'inscrivent dans le cadre de la sdr. T (segmented discourse representation theory). Nous insistons egalement sur la necessite de gerer rigoureusement des phenomenes semantiques comme les inferences implicites ou les presuppositions.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 258 p.
  • Notes : Publication autorisée par le jury
  • Annexes : 151 ref.

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris Diderot - Paris 7. Service commun de la documentation. Bibliothèque Universitaire des Grands Moulins.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.