Découverte du protolexique par apprentissage multimodal et non-supervisé

par Marvin Lavechin

Projet de thèse en Sciences cognitives option Intelligence artificielle

Sous la direction de Alejandrina Cristia, Emmanuel Dupoux et de Hervé Bredin.

Thèses en préparation à l'Université Paris sciences et lettres , dans le cadre de École doctorale Cerveau, cognition, comportement , en partenariat avec LABORATOIRE DE SCIENCES COGNITIVES ET PSYCHOLINGUISTIQUE (laboratoire) et de Ecole normale supérieure (établissement opérateur d'inscription) depuis le 01-09-2019 .


  • Résumé

    Des gazouillis aux premiers mots, en passant par les babillages, l'apprentissage du langage chez les enfants se fait de manière progressive durant les premières années de vie. Avant même la fin de leur première année, certaines études montrent que les jeunes enfants seraient capables d'extraire des régularités statistiques dans les paroles auxquelles ils sont exposés. Ces indices statistiques participent à la construction d'un protolexique, une structure représentant une approximation du lexique, contenant ainsi des informations sur la structure et l'ordre des mots composant la langue maternelle de l'enfant. Au fur et à mesure que l'enfant "vit" l'expérience du langage, les indices statistiques s'accumulent et ce protolexique peut-être révisé, convergeant ainsi vers une version stable et fiable du lexique de leur langue maternelle. Le fait que la construction du protolexique apparaisse avant même les premiers mots de l'enfant, suggère que ce processus se déroulerait très largement sans supervision, c'est-à-dire sans recevoir aucune aide, ni corrections de la part de ses parents. De plus, on observe que les enfants souffrant de déficience visuelle ont tendance à connaître un développement du langage plus tard. Ceci suggère l'importance de la vision dans l'apprentissage de notre langue maternelle, et justifie l'approche multimodale (la vue et l'ouïe) que l'on se fixe dans ce projet de thèse. Au carrefour des sciences cognitives, de la psycholinguistique et de l'intelligence artificielle, nous souhaiterions étudier les stratégies computationnelles guidant la construction du protolexique chez les jeunes enfants. En particulier, les questions suivantes pourront être abordées: - Quelles peuvent-être les différences entre l'apprentissage machine et l'apprentissage humain dans la création et la révision du protolexique ? - A quel point le protolexique esst senbsible à certains facteurs ? En particulier, la segmentation de la pariole en mots/non-mots est-elle toujours opérante lorsque la parole est prononcée par quelqu'un d'autre que la mère de l'enfant ? - Comment caractériser l'évolution de ce protolexique au cours des différents stades du développement du langage ? Et quel pourraît être l'impact d'un retard dans la création du protolexique sur les étapes ultérieures du développement du langage ? - Quel rôle joue la vision dans la création du protolexique ? Quel est l'impact d'une déficience visuelle sur la création et la révision du protolexique ? Notre méthodologie s'inscrit dans une approche de rétro-ingénierie appliquée aux sciences cognitives et à la psycholinguistique. En proposant des modèles mathématiques comparables à ceux que pourrait utiliser l'enfant, nous espérons obtenir un meilleur aperçu des processus cognitives qui pourraient être à l'oeuvre dans la création et la révision du protolexique.

  • Titre traduit

    Unsupervised & multimodal protolexicon discovery


  • Résumé

    My thesis topic focus on the Unsupervised & Multimodal Protolexicon Discovery. Before the end of their first year, we observed that young infants use statistical information to build an approximation of the lexicon of their mother tongue, containing a mixture of real words and nonwords. As time goes by, and statistical cues accumulate, this protolexicon can be further refined and updated before converging towards a stable and reliable well formed lexicon. Since young infants start building this protolexicon as early as the age of 6 months, before they can receive any supervisory feedback from their parents, this suggests the largely unsupervised way in which this phenomenon might arise. Moreover, infants suffering from visual impairment tend to have a later language development, suggesting the importance of sight in the process of our mother tongue learning. This justifies our multimodal approach. Our research, at the crossroads of Artificial Intelligence, Cognitive Sciences, & Psycholinguistics might allow us to go a step further for better characterizing the importance of hearing and seeing in the early stages of child language development. By having a better understanding of the evolution of the protolexicon as the child grows, one may hope to predict delays in the language acquisition, and therefore being able to manage the causes of this delay as early as possible. Morever, given the importance of the multimodal and unsupervised aspect of this project, we hope to contribute directly to the Artificial Intelligence community by participating actively to the creation of models handling such data.