De la sémantique structurale à la lexicostatistique : création d’un outil informatique appliqué au conte de tradition orale de la province de Valladolid : une méthode de gestion et de comptabilisation textuelle

par François Le Tollec

Thèse de doctorat en Linguistique. Études hispaniques

Sous la direction de Philippe Cahuzac et de Manuel Montoya.

Soutenue en 2008

à Brest .


  • Résumé

    Un corpus aussi vaste et riche que celui représenté par le conte de tradition orale de la province de Valladolid justifie la création d’un outil lexicostatistique. L’outil informatique permet la visualisation de données précises et exhaustives et la mise en évidence des différentes unités lexicales exploitées au sein des contes extraits d’une part de l’oeuvre de Joaquin DIAZ et d’autre part de l’oeuvre de Aurelio M. ESPINOSA (hijo). Dans un premier temps cette étude s’attache à présenter le contexte géographique et terminologique. Le travail de recherche consiste ensuite en la création d’une base de données lexicales -fruit du dépouillement de l’intégralité du corpus de référence- laquelle représente une vaste banque terminologique répertoriée en différents champs lexicosémantiques, en la comptabilisation et la représentation graphique des données obtenues et en l’interprétation des résultats enregistrés selon une approche sociolinguistique et socioculturelle. A terme, ce travail permet la réalisation d’une classification des récits favorisée par une nouvelle méthode de gestion textuelle.

  • Titre traduit

    From structural semantics to lexicostatistics : creation of a computer program applied to the tale in the oral tradition of the province of Valladolid : a method of text processing and counting


  • Résumé

    A corpus as vast and rich as that of the tale in the oral tradition of the province of Valladolid justifies the creation of a lexicostatistic tool. Computer analysis makes it possible to visualize precise and exhaustive data and to bring to the fore the various lexical units used in tales taken from the works of Joaquin DIAZ and from those of Aurelio M. ESPINOSA (hijo). This study first dwells on the particular regional context and defines the terminological apparatus. It then consists in the creation of a lexical data base -made possible by the processing of the whole corpus- derived from a large terminological body organized into several lexicosemantic categories; in the counting and representing by graphs of the data obtained; and finally in the interpretation of the results, registered and measured according to a sociolinguistic and sociocultural approach. In the end, this study allows the classification of tales by a new method of textual processing.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 2 vol. (718 f.)
  • Annexes : Bibliogr. vol. 1, p. 467-500. Index

Où se trouve cette thèse ?

  • Bibliothèque : Université de Bretagne Occidentale. Service commun de la documentation. Section lettres et sciences sociales.
  • Disponible pour le PEB
  • Cote : TBRX2008/9A-B
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.