Découverte non supervisée de mots à partir de la parole
FR |
EN
Auteur / Autrice : | Robin Algayres |
Direction : | Emmanuel Dupoux, Benoît Sagot |
Type : | Projet de thèse |
Discipline(s) : | Sciences cognitives |
Date : | Inscription en doctorat le Soutenance le 26/09/2023 |
Etablissement(s) : | Université Paris sciences et lettres |
Ecole(s) doctorale(s) : | École doctorale Cerveau, cognition, comportement |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de sciences cognitives et psycholinguistique (1985-....) |
Equipe de recherche : CoML - Cognitive Machine Learning | |
établissement opérateur d'inscription : École normale supérieure (Paris ; 1985-....) | |
Jury : | Président / Présidente : Sharon Goldwater |
Examinateurs / Examinatrices : Emmanuel Dupoux, Herman Kamper, Karen Livescu, Benoît Sagot, Wei-Ning Hsu | |
Rapporteurs / Rapporteuses : Herman Kamper, Karen Livescu |
Mots clés
FR |
EN
Résumé
FR |
EN
En science des données, les appareils de reconnaissance vocale automatique permettent de transcrire à lécrit une phrase dite à loral. Pour cela, ces systèmes ont besoin dune grande quantité de parole annotée, cest à dire que chaque enregistrement audio doit être accompagné de sa transcription textuelle. Cependant, pour la plupart des langages, nous ne possédons que des enregistrements audio et peu, voire aucune annotation. Or, on sait que les nouveau-nés acquièrent leur langage sans laide dannotation textuelle. Par conséquent, dans le but de créer un système de modélisation du langage, nous avons développé un modèle de découverte de mots à partir de la parole qui n'utilise pas de données textuelles.