Weaving an ambiguous lexicon

par Isabelle Dautriche

Thèse de doctorat en Sciences cognitives

Sous la direction de Anne Christophe.

Soutenue le 18-09-2015

à Sorbonne Paris Cité , dans le cadre de École doctorale Interdisciplinaire européenne frontières du vivant (Paris) , en partenariat avec Université Paris Descartes (établissement de préparation) et de Laboratoire de sciences cognitives et psycholinguistique (laboratoire) .

Le président du jury était François Pellegrino.

Le jury était composé de Anne Christophe, Padraic Monaghan, John C. Trueswell, Benoît Crabbé, Kim Plunkett.

Les rapporteurs étaient Padraic Monaghan, John C. Trueswell.

  • Titre traduit

    Construire un lexique ambigu


  • Résumé

    Il y a (au moins) deux questions fondamentales que l’on est amené à se poser lorsqu’on étudie le langage: comment acquiert-on le langage? —le problème d’apprentissage —et pourquoi les langues du monde partagent certaines propriétés mais pas d’autres? —le problème typologique. Dans cette thèse, j’entreprends de relier ces deux domaines en me focalisant sur le lexique, l’ensemble des mots de notre langue et leur sens associés, en posant les questions suivantes: pourquoi le lexique est-il tel qu’il est? Et est-ce que les propriétés du lexique peuvent être (en partie) expliquées par la façon dont les enfants apprennent leur langue? Un des aspects les plus frappants du lexique est que les mots que nous utilisons sont ambigus et peuvent être confondus facilement avec d’autres. En effet, les mots peuvent avoir plusieurs sens (par exemple, les homophones) et sont représentés par un ensemble limité de sons qui augmentent la possibilité qu’ils soient confondus (par exemple, les paires minimales). L’existence de ces mots semble présenter un problème pour les enfants qui apprennent leur langue car il a été montré qu’ils ont des difficultés à apprendre des mots dont les formes sonores sont proches et qu’ils résistent à l’apprentissage des mots ayant plusieurs sens. En combinant une approche computationnelle et expérimentale, je montre, quantitativement, que les mots du lexique sont, en effet, plus similaires que ce qui serait attendu par chance, et expérimentalement, que les enfants n’ont aucun problème à apprendre ces mots à la condition qu’ils apparaissent dans des contextes suffisamment distincts. Enfin, je propose que l’étude des mots ambigus permet de révéler des éléments importants du mécanisme d’apprentissage du langage qui sont actuellement absents des théories actuelles. Cet ensemble d’études suggère que les mots ambigus et les mots similaires, bien que présents dans le langage, n’apparaissent pas arbitrairement dans le langage et que leur organisation reflète (en partie) la façon dont les enfants apprennent leur langue.


  • Résumé

    Modern cognitive science of language concerns itself with (at least) two fundamental questions: how do humans learn language? —the learning problem —and why do the world’s languages exhibit some properties and not others? —the typology problem. In this dissertation, I attempt to link these two questions by looking at the lexicon, the set of word-forms and their associated meanings, and ask why do lexicons look the way they are? And can the properties exhibited by the lexicon be (in part) explained by the way children learn their language? One striking observation is that the set of words in a given language is highly ambiguous and confusable. Words may have multiple senses (e.g., homonymy, polysemy) and are represented by an arrangement of a finite set of sounds that potentially increase their confusability (e.g., minimal pairs). Lexicons bearing such properties present a problem for children learning their language who seem to have difficulty learning similar sounding words and resist learning words having multiple meanings. Using lexical models and experimental methods in toddlers and adults, I present quantitative evidence that lexicons are, indeed, more confusable than what would be expected by chance alone. I then present empirical evidence suggesting that toddlers have the tools to bypass these problems given that ambiguous or confusable words are constrained to appear in distinct context. Finally, I submit that the study of ambiguous words reveal factors that were currently missing from current accounts of word learning. Taken together this research suggests that ambiguous and confusable words, while present in the language, may be restricted in their distribution in the lexicon and that these restrictions reflect (in part) how children learn languages.

Accéder en ligne

Par respect de la propriété intellectuelle des ayants droit, certains éléments de cette thèse ont été retirés.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris Descartes-Bibliothèque électronique. Service commun de la documentation. Bibliothèque électronique.
  • Bibliothèque : Université Paris 13 (Villetaneuse, Seine-Saint-Denis). Bibliothèque universitaire. Section Droit/Lettres.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.