Changements syntaxiques dans le Yorùbá de la presse (1930-2010) : traitement automatique d'un corpus diachronique et analyse des résultats

par Nicolas, Christophe Aubry

Thèse de doctorat en Langues, littératures et sociétés du monde

Sous la direction de Konstantin Igorevič Pozdnâkov.

Soutenue en 2010

à Paris, INALCO .


  • Résumé

    Nous effectuons un traitement automatique, avec un étiqueteur morphosyntaxique, d'un corpus diachronique de 400 000 mots constitué de journaux en langue yorùbá (Nigeria) publiés entre les années 1930 et les années 2000, saisi et standardisé manuellement. Les résultats de cet étiquetage servent dans un deuxième temps de données à une analyse des changements syntaxiques intervenus au cours de cette période. L'accent est mis sur les phénomènes de grammaticalisation et les constructions verbales sérielles. Le chapitre 1 présente le yorùbá dans le cadre théorique de la Grammaire Lexicale Fonctionnelle (Lexical Functional Grammar, LFG) et décrit l'outil d'étiquetage. Le chapitre 2 présente la presse yorùbá d'un point de vue historique, décrit le corpus et sa standardisation et se clôt sur une étude succinte du vocabulaire de la presse. Le chapitre 3 présente les changements syntaxiques découverts

  • Titre traduit

    Syntactic changes in newspapers' Yoruba (1930-2010) : automatic processing of a diachronic corpus and an analysis of the results


  • Résumé

    We use a part-of-speech tagger for an automatic processing of a 400. 000 words diachronic corpus of newspapers in Yoruba language (Nigeria) published between the 1930's and the 2000's, typed and standardized manually. The results of this tagging are then used as data for an analysis of syntactic changes having occured during that period. The focus is on grammaticalisation phenomena and serial verb constructions. Chapter 1 presents the yoruba language in the Lexical Functional Grammar framework and describes the tagger. Chapter 2 introduces the Yoruba press from a historical perspective, describes the corpus and its standardization, and ends on a brief study of the press vocabulary. Chapter 3 presents the syntactic changes that have been discovered

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 2 vol. (221-531 f.)
  • Annexes : Bibliogr. f. 217

Où se trouve cette thèse ?

  • Bibliothèque : Bibliothèque universitaire des langues et civilisations (Paris).
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.