Approche quantitative au développement d'un modèle théorique de la perception des langues étrangères basé sur la proximité phonétique

par Adriana Guevara Rukoz

Projet de thèse en Sciences cognitives

Sous la direction de Emmanuel Dupoux et de Sharon Peperkamp.

Thèses en préparation à Paris Sciences et Lettres , dans le cadre de École doctorale Cerveau, cognition, comportement (Paris) , en partenariat avec LABORATOIRE DE SCIENCES COGNITIVES ET PSYCHOLINGUISTIQUE (laboratoire) et de École normale supérieure (Paris ; 1985-....) (établissement de préparation de la thèse) depuis le 01-10-2015 .


  • Résumé

    La perception des langues étrangères est déformée par l'influence de l'inventaire de sons de la langue maternelle. Bien que des phénomènes de perception erronée aient été largement documentés, il n'y a actuellement pas de modèle théorique des mécanismes perceptifs qui en rende compte de manière uniforme. Les modèles phonétiques suggèrent que les sons non-natifs sont assimilés à la catégorie native la plus proche, phonétiquement parlant. Cependant, la notion de “distance phonétique” n'a pas été bien définie jusqu'à présent. L'objectif principal de ce projet est de trouver une définition satisfaisante pour la distance acoustique, à partir de laquelle nous construirons un modèle computationnel de la perception de la parole étrangère, en utilisant des outils de reconnaissance automatique de la parole. Avec une approche quantitative, nous extrairons des prédictions sur des confusions de sons. Nous testerons notre modèle en comparant les erreurs de transcription faites par celui-ci à des erreurs faites par des personnes dans des expériences comportementales analogues.

  • Titre traduit

    A quantitative approach to developing a theoretical model of foreign speech perception based on phonetic proximity


  • Résumé

    Perception of foreign speech is hampered by confusions that listeners make between foreign sounds, possibly due to interferences from the sound inventory of the native language. While phenomena of foreign speech misperception have been extensively documented, there is currently no theoretical model of the underlying perceptual mechanisms that uniformly accounts for all observed errors. Phonetics-based models posit that non-native sounds are assimilated to the phonetically closest native category. However, current definitions of perceptual distance seem incomplete. The goal of this project is, first and foremost, to find a satisfactory definition for phonetic distance. From it, we aim to develop a computational model of foreign speech perception by using tools from automatic speech recognition (ASR). With a quantitative approach, numerical predictions will be derived, from which the most prominent ones will be verified experimentally. Transcription errors made by a native-language model confronted to foreign speech will be compared to errors made by humans in analogous behavioral experiments.