Thèse en cours

Découverte non supervisée de mots à partir de la parole

FR  |  
EN

Accès à la thèse

Triangle exclamation pleinLa soutenance a eu lieu le 26/09/2023. Le document qui a justifié du diplôme est en cours de traitement par l'établissement de soutenance.
Auteur / Autrice : Robin Algayres
Direction : Emmanuel DupouxBenoît Sagot
Type : Projet de thèse
Discipline(s) : Sciences cognitives
Date : Inscription en doctorat le
Soutenance le 26/09/2023
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : École doctorale Cerveau, cognition, comportement
Partenaire(s) de recherche : Laboratoire : Laboratoire de sciences cognitives et psycholinguistique (1985-....)
Equipe de recherche : CoML - Cognitive Machine Learning
établissement opérateur d'inscription : École normale supérieure (Paris ; 1985-....)
Jury : Président / Présidente : Sharon Goldwater
Examinateurs / Examinatrices : Emmanuel Dupoux, Herman Kamper, Karen Livescu, Benoît Sagot, Wei-Ning Hsu
Rapporteurs / Rapporteuses : Herman Kamper, Karen Livescu

Résumé

FR  |  
EN

En science des données, les appareils de reconnaissance vocale automatique permettent de transcrire à l’écrit une phrase dite à l’oral. Pour cela, ces systèmes ont besoin d’une grande quantité de parole annotée, c’est à dire que chaque enregistrement audio doit être accompagné de sa transcription textuelle. Cependant, pour la plupart des langages, nous ne possédons que des enregistrements audio et peu, voire aucune annotation. Or, on sait que les nouveau-nés acquièrent leur langage sans l’aide d’annotation textuelle. Par conséquent, dans le but de créer un système de modélisation du langage, nous avons développé un modèle de découverte de mots à partir de la parole qui n'utilise pas de données textuelles.