Un composant linguistique de production de phrases basé sur le formalisme des graphes conceptuels

par Ouahiba Benchouk

Thèse de doctorat en Informatique et mathématiques

Sous la direction de Paul Sabatier.


  • Résumé

    Le travail que nous presentons dans cette these entre dans le cadre de la generation automatique de textes et plus exactement dans la phase generation de surface. Nous proposons un outil generique, base sur un formalisme de representation des connaissances connu et bien defini, celui des graphes conceptuels de sowa. Ce formalisme est tres approprie pour le traitement de la langue naturelle et repond bien a nos exigences; les methodes et les algorithmes que nous developpons y sont tres lies. La premiere tache du composant linguistique est le choix des mots qui expriment le contenu de la representation semantique. L'algorithme que nous proposons est base sur la generalisation, la projection et la contraction de type. Les contraintes syntaxiques qui sont attachees aux descriptions semantiques des mots evitent la production de nombreuses incoherence syntaxiques mais n'assurent pas la production de structure de surface syntaxiquement correctes. Pour verifier l'ensemble des contraintes syntaxiques, les completer par un traitement des mots de la classe fermee (article, auxiliaire, preposition) et effectuer les accords, il est necessaire de produire une structure d'arbre qui sera l'entree de la grammaire. Pour eliminer les concepts redondants et eviter de produire des phrases contenant des repetitions, nous proposons un algorithme de pronominalisation qui combine les criteres suivants: distance, morpho-syntaxe, conceptuel, contraintes intra-phrase


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 140 f.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr.f. 127-140

Où se trouve cette thèse ?

  • Bibliothèque : Université Aix-Marseille (Marseille. Luminy). Service commun de la documentation. Bibliothèque de sciences.
  • Disponible pour le PEB
  • Cote : 23083
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.