Analyse macro-sémantique des structures rhétoriques du discours : cadre théorique et modèle opératoire

par Antoine Widlöcher

Thèse de doctorat en Informatique

Sous la direction de Patrice Enjalbert.

Soutenue en 2008

à Caen .


  • Résumé

    Dans le domaine du Traitement Automatique des Langues (TAL), notre étude porte sur l'analyse des structures rhétoriques du discours, c'est-à-dire des stéréotypes organisationnels qui participent au cheminement argumentatif des textes. Nous visons la constitution d'un cadre théorique et opérationnel général, permettant la modélisation et l'exploration computationnelle d'une variété significative de telles structures. Nous proposons notamment d'articuler leur analyse autour des trois catégories élémentaires que sont unités, relations et schémas, et envisageons différentes propriétés récurrentes des structures et des mécanismes indiciaires sous-jacents: variabilité du grain, flexibilité, non-linéarité et non-séquentialité potentielles, interactions local/global. . . Afin de procéder à la description formelle des phénomènes linguistiques étudiés et à l'opérationalisation de leur analyse sur corpus, nous proposons le formalisme CDML (Contraint-based Discourse Modeling Language), qui permet de modéliser des structures discursives par l'expression de contraintes sur des objets textuels de différentes natures (morphologique, syntaxique, sémantique. . . ), à différents niveaux de grain. Un analyseur permet de projeter ces contraintes sur corpus pour identifier les structures décrites. Deux études de cas ont par ailleurs été entreprises, sur deux types de structures significativement différentes, qui illustrent nos principes d'analyses, notre modèle formel et notre méthode d'opérationalisation. La première porte sur l'hypothèse de l'encadrement du discours de M. Charolles, et la seconde explore les relations de contraste à différentes échelles, entre des objets linguistiques variés.

  • Titre traduit

    Macro-semantic analysis of rhetorical structures of discourse : theoretical framework and computational model


  • Résumé

    In the general field of Natural Language Processing (NLP), this work concerns the analysis of the rhetorical structure of discourse, which consists in the argumentative organization of texts through various stereotypes. Our main goal was to define a theoretical and computational framework allowing formal modeling and automatic exploration of various discursive structures involved in this textual organization. We notably propose to describe those structures using the three elementary categories of units, relations and schemas, and outline recurrent properties of discursive patterns and clues which signal their presence: variable granularity, fuzziness, possible non-linearity and non-sequentiality, local/global interactions. . . In order to give a formal description of the studied linguistic phenomena and to make their computational analysis possible, in a corpus-based approach, we propose the CDML formalism (Contraint-based Discourse Modeling Language). It allows to design formal models of discursive patterns by means of constraints expressed on textual objects whose nature (morphologic, syntactic, semantic. . . ) and whose granularity level may vary. A CDML parser has been implemented and may be used to apply such a formal description to a corpus and automatically detect textual structures satisfying the given constraints. In addition, we present two case studies dedicated to significantly different discursive patterns and illustrating our analysis principles, formal model and computational approach. The first one concerns Charolles' discourse framing theory. The second considers contrastive relations between various kind of textual objects, at different granularity levels.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (429 p.)
  • Annexes : Bibliogr. p.421-429. Index

Où se trouve cette thèse ?

  • Bibliothèque : Université de Caen Normandie. Bibliothèque universitaire Sciences - STAPS.
  • Non disponible pour le PEB
  • Cote : TCAS-2008-42
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.