L'ambiguïté anaphorique et la résolution automatique de l'anaphore pronominale. Propositions méthodologiques à partir d'un corpus fermé de résumés d'œuvres littéraires en français (RESUMAN)

par Afef Selmi (Kasmi)

Projet de thèse en Sciences du langage

Sous la direction de Laurent Gautier.

Thèses en préparation à Bourgogne Franche-Comté , dans le cadre de École doctorale Lettres, Communication, Langues, Arts (Dijon ; Besançon ; 2017-....) , en partenariat avec Centre Interlangues (laboratoire) et de Modèles et Discours (equipe de recherche) depuis le 30-10-2012 .


  • Résumé

    Vu les ambiguïtés que créent les anaphores au niveau des langages naturelle, plusieurs chercheurs du domaine du traitement automatique des langues (TAL) ont mis en place divers approches pour résoudre le problème. Nous nous proposons d'adapter ces approches à la résolution automatique des anaphores pronominales dans RESUMAN. Dans la première partie sont présentés les modèles cognitifs, linguistiques et textuelles qui rendent compte du fonctionnement et de l'interprétation des pronoms. Dans la deuxième partie, les procédures d'interprétation des anaphores pronominales sont exposées : la procédure de distance minimale, la procédure des fonctions parallèles, la procédure du sujet ou la procédure thématique, ainsi que les procédures d'analyse morphologique, sémantique et pragmatique. Dans la troisième partie, une nouvelle version d'algorithme, se basant sur une approche statistique, est présentée. L'outil RESUMAN permet d'améliorer les performances d'un TAL en cas de textes denses en anaphores. Les performances de ce logiciel sont évaluées et ses limites sont commentées.

  • Titre traduit

    The ambiguity of anaphora and automatic pronominal anaphora resolution. Methodological Proposals from a closed body of abstracts of literary works in french (RESUMAN)


  • Résumé

    Given the ambiguities created by the anaphora at the natural languages, many researchers in the field of natural language processing (NLP) have implemented various approaches to solving the problem. We propose to adapt these approaches to the automatic pronominal anaphora resolution in RESUMAN. In the first part presents the cognitive models, linguistic and textual that reflect the operation and interpretation of pronouns. In the second part, the procedures for interpretation of pronominal anaphora are on display: the minimum distance of procedure, the procedure parallel functions, the procedure of the subject or the theme proceedings and procedures morphological analysis, semantics and pragmatics. In the third part, a new version of algorithm, based on a statistical approach, is presented. The RESUMAN software improves the performance of a TAL in case of dense texts anaphora. The performance of this software are evaluated and limits are discussed.