Modélisation informatique de structures dynamiques de segments textuels pour l'analyse de corpus

by François Daoust

Doctoral thesis in Sciences du langage

Under the supervision of Jean-Marie Viprey and Yves Marcoux.

Thesis committee President: Jules Duchastel.

Thesis committee members: Jean-Marie Viprey, Yves Marcoux, Lou Burnard, André Salem.

Examiners: Lou Burnard, André Salem.

  • Alternative Title

    Data-processing modeling of dynamic structures of textual segments for the analysis of corpus


  • Abstract

    The objective of the thesis is to propose a data-processing model to represent, build and exploit textualstructures. The suggested model relies on a «type/token» form of text representation extended bysystems of lexical and contextual annotations. This model's establishment was carried out in the SATOsoftware -- of which the functionalities and the internal organization are presented. Reference to anumber of works give an account of the development and use of the software in various contexts.The formal assumption of the textual and discursive structures find an ally in the beaconing XMLlanguage and the proposals of the Text Encoding Initiative (TEI). Formally, the structures built on thetextual segments correspond to graphs. In a development driven textual analysis context, these graphsare multiple and partially deployed. Their resolution, within the fastening of the nodes to textualsegments or that of other graphs, is a dynamic process which can be sustained by various dataprocessingmechanisms. Examples drawn from textual linguistics are used to illustrate the principles ofstructural annotation. Prospective considerations for the data-processing establishment of amanagement system of the structural annotation are also exposed.


  • Abstract

    L'objectif de la thèse est de proposer un modèle informatique pour représenter, construire et exploiterdes structures textuelles. Le modèle proposé s'appuie sur une représentation du texte sous la forme d'unplan lexique/occurrences augmenté de systèmes d'annotations lexicales et contextuelles, modèle dontune implantation a été réalisée dans le logiciel SATO dont on présente les fonctionnalités etl'organisation interne. La présentation d'un certain nombre de travaux rendent compte dudéveloppement et de l'utilisation du logiciel dans divers contextes.La prise en charge formelle des structures textuelles et discursives trouve un allié dans le langage debalisage XML et dans les propositions de la Text Encoding Initiative (TEI). Formellement, lesstructures construites sur les segments textuels correspondent à des graphes. Dans le contexte d'uneanalyse textuelle en élaboration, ces graphes sont multiples et partiellement déployés. La résolution deces graphes, au sens du rattachement des noeuds à des segments textuels ou à des noeuds d'autresgraphes, est un processus dynamique qui peut être soutenu par divers mécanismes informatiques. Desexemples tirés de la linguistique textuelle servent à illustrer les principes de l'annotation structurelle.Des considérations prospectives sur une implantation informatique d'un système de gestion del'annotation structurelle sont aussi exposées.


It's available in the institution of thesis defence.

Consult library

Version is available

Informations

  • Details : 2 vol. (401 p.)
  • Annexes : Bibliogr. en fin de chap. Index

Where is this thesis?

  • Library : Bibliothèque universitaire. Section Lettres.
  • Available for PEB
  • Odds : LET.BESA.2011.013.1
  • Library : Bibliothèque universitaire. Section Lettres.
  • Available for PEB
  • Odds : LET.BESA.2011.013.2
  • Library : Bibliothèque universitaire électronique, Besançon.
See the Sudoc catalog libraries of higher education and research.