Thèse soutenue

Un composant linguistique de production de phrases basé sur le formalisme des graphes conceptuels

FR  |  
EN
Auteur / Autrice : Ouahiba Benchouk
Direction : Paul Sabatier
Type : Thèse de doctorat
Discipline(s) : Informatique et mathématiques
Date : Soutenance en 1994
Etablissement(s) : Aix-Marseille 2
Partenaire(s) de recherche : Autre partenaire : Université d'Aix-Marseille II. Faculté des sciences (1969-2011)

Mots clés

FR

Mots clés contrôlés

Résumé

FR

Le travail que nous presentons dans cette these entre dans le cadre de la generation automatique de textes et plus exactement dans la phase generation de surface. Nous proposons un outil generique, base sur un formalisme de representation des connaissances connu et bien defini, celui des graphes conceptuels de sowa. Ce formalisme est tres approprie pour le traitement de la langue naturelle et repond bien a nos exigences; les methodes et les algorithmes que nous developpons y sont tres lies. La premiere tache du composant linguistique est le choix des mots qui expriment le contenu de la representation semantique. L'algorithme que nous proposons est base sur la generalisation, la projection et la contraction de type. Les contraintes syntaxiques qui sont attachees aux descriptions semantiques des mots evitent la production de nombreuses incoherence syntaxiques mais n'assurent pas la production de structure de surface syntaxiquement correctes. Pour verifier l'ensemble des contraintes syntaxiques, les completer par un traitement des mots de la classe fermee (article, auxiliaire, preposition) et effectuer les accords, il est necessaire de produire une structure d'arbre qui sera l'entree de la grammaire. Pour eliminer les concepts redondants et eviter de produire des phrases contenant des repetitions, nous proposons un algorithme de pronominalisation qui combine les criteres suivants: distance, morpho-syntaxe, conceptuel, contraintes intra-phrase