Apprentissage non supervisé de modèles multilingues de représentation dela parole, une approche inspirée des sciences cognitives

Maureen De seyssel

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

FR |

EN

Accès à la thèse

La soutenance a eu lieu le 27/11/2023. Le document qui a justifié du diplôme est en cours de traitement par l'établissement de soutenance.

Auteur / Autrice :	Maureen De seyssel
Direction :	Emmanuel Dupoux
Type :	Projet de thèse
Discipline(s) :	Sciences cognitives
Date :	Inscription en doctorat le Soutenance le 27/11/2023
Etablissement(s) :	Université Paris sciences et lettres
Ecole(s) doctorale(s) :	École doctorale Cerveau, cognition, comportement
Partenaire(s) de recherche :	Laboratoire : Laboratoire de sciences cognitives et psycholinguistique (1985-....)
	Equipe de recherche : CoML - Cognitive Machine Learning
	établissement opérateur d'inscription : École normale supérieure (Paris ; 1985-....)
Jury :	Président / Présidente : Martine Adda-decker
	Examinateurs / Examinatrices : Emmanuel Dupoux, Hao Tang, Odette Scharenborg, Maria Giavazzi, Hervé Bredin, Casey Lew-williams
	Rapporteurs / Rapporteuses : Hao Tang, Odette Scharenborg

Mots clés

FR |

EN

Mots clés libres

Unsupervised speech processing

Sciences cognitives

Psycholinguistique

Multilingue

Apprentissage machine

Résumé

FR |

EN

La parole, essentielle à lacquisition du langage, véhicule différents types dinformations. Parmis elles, celles linguistiques (propres au sens du message communiqué) et in- dexicales (liées à lidentité du locuteur, dont la langue parlée). Dans cette thèse, nous nous intéressons à la manière dont les nourrissons traitent ces deux types dinformations. Nous explorons de quelle façon les spécificités de lenvironnement linguistique dun nourrisson, en particulier lexposition à des langues multiples et diverses, façonnent leur perception de la parole. Nous nous demandons également si la représentation des informations indexicales, et des langues en particulier, peut influencer lapprentissage linguistique. En adoptant une approche de modélisation computationnelle, nous modélisons la représentation des informations indexicales et linguistiques lors de la perception de la parole chez le nourrisson, en tirant parti des avancées récentes en matière dapprentissage automatique et de traitement de la parole. Par conséquent, nos contributions ont des implications significatives à la fois pour les sciences cognitives et pour le traitement de la parole. Tout au long de cette thèse, nous modélisons tour à tour la perception indexicale de la parole et la perception linguistique de la parole (qui implique la simulation de lacquisition du langage) à partir de parole comme seule donnée dentrée, sous différentes conditions, et en mettant particulièrement laccent sur lentrée de parole multilingue. Cette modélisation est passée par le développement de structures et de mesures appropriées pour des simulations dapprentissage linguistique. Notre travail nous permet de souligner les avantages de la modélisation informatique dans la perception de la parole et lapprentissage du langage chez le bébé, en fournissant des lignes directrices pour une telle approche. Ces simulations nous permettent également déclairer certaines hypothèses sur le traitement de la parole chez les nourrissons en servant de preuves de concept. Nous avons constaté que les mécanismes dapprentissage statistique étaient suffisants pour simuler lacquisition précoce du langage chez les nourrissons monolingues. Cependant, bien que nous ayons constaté un apprentissage linguistique avec les mêmes mécanismes avec des données dentrées bilingues, nous navons pas pu reproduire les tendances observées chez les nourrissons bilingues. Ceci pourrait suggérer que ces mécanismes statistiques ne sont pas suffisants dans leur processus dapprentissage du langage. Pour finir, nous examinons également les implications de notre travail dans le domaine du traitement de la parole, en discutant de leffet de la distance linguistique et de linterférence négative.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Apprentissage non supervisé de modèles multilingues de représentation dela parole, une approche inspirée des sciences cognitives

Accès à la thèse

Mots clés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Apprentissage non supervisé de modèles multilingues de représentation dela parole, une approche inspirée des sciences cognitives

Accès à la thèse

Mots clés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses