Méthodes de la statistique textuelle

par André Salem

Thèse de doctorat en Lettres

Sous la direction de Maurice Tournier.

Soutenue en 1993

à Paris 3 .


  • Résumé

    Methods for textual statistics, a multidisciplinary work, presents a critical overview of statistical studies on vocabulary. The first part is devoted to the definition of textual units and to the adaptation of a set of statistical methods (mainly multidimensional statistical methods) to textual studies. That set of lexicometric methods has also been used in various fields dealing with textual data. Beyond the diversity of the domains, lexicometrical methods reveal contrasts between distributions of forms and repeated segments throughout the texts. Those contrasts found pertinent interpretation in each case. Numerous studies performed over chronological textual series show the importance of a same phenomenon: qualitative and quantitative evolution of the vocabulary as time goes by. Taking into account time-variable leads to a better characterization of the successive time periods, or groups of periods, based upon the vocabulary they use. Coefficients calculated on the basis of the distribution of textual units (forms and repeated segments) through the different periods of the corpus, lead to compare the empirical periodizations resulting from chronological analysis of the lexical amount with a priori periodizations based on important dates of the period covered by the corpus.

  • Titre traduit

    Methods for textual statistics


  • Résumé

    A l'intersection de plusieurs disciplines, méthodes de la statistique textuelle présente un bilan de recherches consacre a l'étude statistique du vocabulaire. Le premier volume est consacre a la définition des unités textuelles, a la présentation et a l'adaptation au domaine des études textuelles de plusieurs méthodes d'analyse statistique ainsi qu'a l'application de ces méthodes a différents domaines de recherche utilisant le texte. Un même ensemble de méthodes lexico métriques permet, malgré la diversité des domaines abordés, de mettre en évidence des contrastes dans la ventilation des formes et des segments qui trouvent des interprétations pertinentes pour chacun des corpus soumis à comparaison. Les études réalisées sur des séries textuelles chronologiques mettent en évidence l'importance d'un même phénomène lie à l'évolution d'ensemble du vocabulaire au fil du temps. La prise en compte de la variable temps permet de mieux caractériser les périodes ou les groupes de périodes successives, en fonction du vocabulaire qu'elles emploient. Des coefficients calculés a partir des sous-fréquences de chacune des unités textuelles (formes et segments répétés du corpus) permettent de mettre en rapport les périodisations empiriques obtenues sur la base de l'analyse chronologique du stock lexical avec les découpages a priori, réalisés a partir des dates importantes autour desquelles le corpus a été réuni.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 3 vol. (819, 179 f.)
  • Notes : Publication autorisée par le jury

Où se trouve cette thèse ?

  • Bibliothèque : Bibliothèque Diderot Centre Doc Recherche (Lyon).
  • Non disponible pour le PEB
  • Cote : T 1993 SAL
  • Bibliothèque : Université Sorbonne Nouvelle. Direction des Bibliothèques Universitaires. Section Censier.
  • Disponible pour le PEB
  • Bibliothèque : Université Sorbonne Nouvelle. Direction des Bibliothèques Universitaires. Section Censier.
  • Accessible pour le PEB
  • Bibliothèque : Analyse et traitement informatique de la langue française. UMR C7118. Bibliothèque.
  • Disponible pour le PEB
  • Cote : CVj1 SAL
  • Bibliothèque : Centre Technique du Livre de l'Enseignement supérieur (Marne-la-Vallée, Seine-et-Marne).
  • Disponible pour le PEB
  • Cote : I 4= 16964-<1 À 3>

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Bibliothèque interuniversitaire de la Sorbonne (Paris).
  • Non disponible pour le PEB
  • Cote : TMC 1584
  • Bibliothèque : Université de Lorraine. Direction de la Documentation et de l'Edition. Bibliothèque universitaire Lettres et sciences humaines.
  • Disponible pour le PEB
  • Cote : Mf 11173
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.