La notion de collocation fondamentale : étude de corpus en vue d'une exploitation didactique

par Veronica Benigno

Thèse de doctorat en Didactique & Linguistique

Sous la direction de Francis Grossmann et de Antonino Velez.

Le président du jury était Vincenzo Lo Cascio.

Le jury était composé de Francis Grossmann, Antonino Velez, Olivier Kraif.

Les rapporteurs étaient Vincenzo Lo Cascio, Francesco Paolo Alexandre Madonia.


  • Résumé

    L'objet d'étude de la présente recherche est la notion de « collocation fondamentale ». Nous calquons ce terme sur celui de « vocabulaire fondamental », issu de la dénomination Français fondamental utilisée par Gougenheim et al. (1964) pour désigner le vocabulaire de base de la langue française. Dans la thèse, les collocations fondamentales sont envisagées comme des unités polylexicales significatives (unies par des liens collocationnels) fréquentes (dans l'usage) ou non fréquentes (lorsqu'elles sont pertinentes pour la communication) qui représentent pour les locuteurs natifs les contextes de cooccurrence les plus essentiels et les plus typiques d'un mot pivot donné. Les études descriptives ou acquisitionnelles sur les collocations sont assez récentes et, à notre connaissance, ne se sont pas encore intéressées à cette notion, qui devrait pourtant constituer une étape préliminaire cruciale dans toute approche didactique destinée aux apprenants de langue étrangère. La présente étude se veut une recherche qualitative et quantitative d'un échantillon de collocations fondamentales constitué à partir de dix substantifs pivots représentant des « événements sociaux ». Le corpus que nous avons analysé est frWac (Baroni et al., 2010), un très vaste corpus écrit issu du Web analysé à l'aide de scripts Perl développés par Olivier Kraif (2011). A partir des pivots choisis, nous avons extrait de ce corpus les associations candidates au statut de collocations fondamentales ; puis nous avons demandé à 90 locuteurs natifs du français de sélectionner celles qui leur apparaissaient essentielles pour la communication. L'objectif a été d'évaluer, à l'aide de l'intuition de locuteurs natifs, la validité de l'échantillon automatiquement constitué, et de comprendre de quoi dépendait l'assignation du caractère fondamental de la part des enquêtés. Nous avons obtenu deux résultats principaux : - En premier lieu, nous avons constaté l'existence d'une corrélation faiblement positive, mais non systématique, entre la fréquence des associations dans le corpus et le score obtenu pour les associations sélectionnées par les locuteurs natifs. - En second lieu, nous avons constaté que lorsque la fréquence ne jouait pas de rôle, pour les enquêtés, dans l'attribution du caractère fondamental, alors la cause était à chercher dans le figement. En effet, dans des cas singuliers, les associations peu fréquentes sont sélectionnées parce qu'elles comportent un certain degré de figement ; à l'inverse, les associations les plus fréquentes sont exclues parce qu'elles sont perçues comme libres. Enfin, nous avons présenté la notion de collocation fondamentale en vue d'une exploitation didactique : à travers l'analyse de la structuration du domaine sémantique des « événements sociaux » qui nous a servi d'exemple, nous avons montré l'importance du repérage des « collocations fondamentales » afin d'opérer la sélection du vocabulaire à enseigner en classe de FLE.

  • Titre traduit

    The notion of core collocation : a corpus-based study with teaching applications


  • Résumé

    The focus of the present study is the concept of core collocation. This term is defined with reference to the core vocabulary list produced by Gougenheim et al. (1964), Le Français Fondamental. Despite the fact that the importance of this list is broadly acknowledged, a critical point is that the analysis of the syntagmatic level was neglected. From this awareness, we develop the main focus of the present research and our basic assumption that the criteria applied to define core vocabulary, mainly frequency and availability, should be equally applied to define core collocations, a key concept in L2 teaching. We define core collocations as significative (the collocational relation), frequent (the usage) or available (essential for accomplishing basic communicative tasks) units representing the most basic co-occurrences of a word. This study aims to define core collocations through the investigation of a sample of collocations associated with ten basic nouns in a lexical area of interest for second language learners, the one of social relations. The corpus that we investigated is frWaC (Baroni et al., 2010), a lemmatized web-derived corpus assembled through automated procedures crawling the Web. The corpus was analyzed using a tool based on programming scripts Perl developed by Olivier Kraif (2011). The extraction tool makes use of frequency, dispersion and four associative measures (mutual information, log likelihood, t-score and z-score) and produces concordance lines. We chose the ten pivot nouns, we extracted the most frequent and available collocations and we evaluated the extracted sample through a comparison between 90 native speakers' intuitions about core collocations with statistical data. The results of the present research can be summarized as follows: - Since the most frequent collocations also received the highest number of votes by the tested subjects, we claim that frequency is a crucial feature in dictating the lexical choices made by speakers. However, some associations represent outliers: they are deviating points from the normal distribution of correlation between frequency and coreness attributed by native speakers. We might conclude that there is a certain linear correlation between the two variables but that this correlation is not systematic. - What is core is not only a matter of frequency, but it also depends on units' fixedness. Native speakers sometimes ignore frequent associations since they have a loose degree of fixedness, being rather free combinations; whereas other times they chose low frequent associations that they perceive as being very fixed. This study finally draws important pedagogical implications. The analysis of core collocations in the semantic area of “social relations” served us to explain which criteria can be adopted to run a filter across the wide set of phraseological units a given word produces, helping L2 teachers to find criteria to select the essential items to be taught first.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Service Interétablissement de Documentation. LLSH Collections numériques.
  • Bibliothèque : Université Savoie Mont Blanc (Chambéry-Annecy). Service commun de la documentation et des bibliothèques universitaires. Bibliothèque électronique.
  • Bibliothèque : Service interétablissements de Documentation. STM. Collections numériques.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.