Analyse linguistique et formalisation pour le traitement automatique de la paraphrase

par Wannachai Kampeera

Thèse de doctorat en Sciences du langage. Traitement automatique des langues

Sous la direction de Sylviane Cardey-Greenfield.

Soutenue le 29-04-2013

à Besançon , dans le cadre de Ecole doctorale Langages, Espaces, Temps, Sociétés (Besançon) , en partenariat avec Centre de recherche en linguistique et traitement automatique des langues, Lucien Tesnière (Besançon) (laboratoire) et de Centre de recherche en linguistique et traitement automatique des langues, Lucien Tesnière (laboratoire) .


  • Résumé

    Les relations paraphrastiques entre plusieurs ensembles de paraphrasespeuvent se décrire en termes de suites de transformations textuelles. Pour qu’il aitparaphrase, il faut qu’une substitution lexicale noyau se mette en route entrainantd’autres modifications syntaxiques, lexicales et morphologiques.Après avoir décrit les mécanismes de paraphrasage récurrents, nous avons proposédeux formalisations. La première est théorique et explique les différentes relationsparaphrastiques entretenues par les paraphrases entre-elles. La deuxième,tournée vers des applications, formalise les structures paraphrastiques sous-formede prédicats-arguments. Nous considérons cette dernière adaptée au traitementautomatique de la paraphrase.Nous avons à la suite implémenté un système d’extraction de structures paraphrastiques.Il s’agit d’un système opérationnel appliqué à un volume de donnéesrelevant de notre domaine d’étude, et dont le but est de donner un exemple concretd’emploi possible de notre formalisation.Mots-clés : paraphrase, structures paraphrastiques, traitement automatique dela paraphrase, extraction des structures paraphrastiques

  • Titre traduit

    Linguistic analysis and formalisation for paraphrase processing


  • Résumé

    The relations between sets of paraphrases can be described as seriesof textual transformations. To rephrase, an initial lexical substitution starts, thentriggers other syntactic, lexical and morphological changes.After having described the frequent paraphrasing mechanisms in our corpus,we propose two formalisations. The first one is theoretical, explaining the differentparaphrasing relationships maintained by the paraphrases between each other. Thesecond formalises paraphrase structures as predicate-argument ones. We considerthe latter suitable for paraphrase processing.Finally we have implemented a paraphrase structures extraction system. Thisis a compact operational system for the volume of data within our domain, the aimof which is to provide a concrete example of a possible use of our formalisation.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Informations

  • Détails : 1 vol. (IX-288p.)
  • Annexes : Bibliographie p.145-149.

Où se trouve cette thèse ?

  • Bibliothèque : Bibliothèque universitaire. Section Lettres.
  • Disponible pour le PEB
  • Cote : LET.BESA.2013.011
  • Bibliothèque : Bibliothèque universitaire électronique, Besançon.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.