Thèse soutenue

Quantification vectorielle et adaptation au locuteur

FR  |  
EN
Auteur / Autrice : Hélène Bonneau
Direction : Joseph Mariani
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 1987
Etablissement(s) : Paris 11
Partenaire(s) de recherche : autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne)
Jury : Président / Présidente : Christian Fluhr
Examinateurs / Examinatrices : Joseph Mariani, Christian Fluhr, René Carré, Gérard Chollet, Jean-Luc Gauvain

Résumé

FR

La plupart des systèmes de reconnaissance de grands vocabulaires utilisent la Quantification Vectorielle pour réduire la quantité d'informations à traiter. Dans le but de résoudre le principal problème actuellement rencontré par ces systèmes (qui est celui du passage au cas multi-locuteur), ce travail concerne l'étude d'une nouvelle méthode d'adaptation au locuteur, par Quantification Vectorielle (Q. V. ). Dans le premier chapitre nous exposons les principes de base de la Q. V. Nous présentons en particulier les différents algorithmes de classification automatique que nous avons utilisés lors de nos différentes expériences pour la construction des répertoires. L'étude des réalisations en reconnaissance de la parole montre que la Q. V. Est maintenant utilisée par de nombreux systèmes de reconnaissance de grands vocabulaires, pour réduire la quantité de données à traiter. Il existe également des réalisations qui utilisent la Q. V. , non plus simplement comme un outil mais comme méthode de reconnaissance (utilisation de la Q. V. Comme préprocesseur ou Q. V. Multi-section). Le second chapitre est consacré à la comparaison des différentes méthodes d'adaptation au locuteur… Les chapitres suivants concernent les différentes expériences que nous avons effectuées au cours de ce travail. Le chapitre 4 résume l’expérience menée dans le but de tester l’efficacité de la Q. V. Dans le cadre d’un système de reconnaissance globale mono-locuteur. L’expérience en identification du locuteur par Q. V. , décrite dans le chapitre 5, nous a permis de vérifier qu’un répertoire peut être utilisé pour représenter l’espace spectral d’un locuteur. Nous avons également comparé l’efficacité de deux méthodes de classification automatique : la méthode incrémentale et une méthode de nuées dynamique (l’algorithme de SPLIT)… La première partie du chapitre 6 décrit le principe de l’adaptation au locuteur par Q. V… La seconde partie du chapitre 6 décrit les expériences réalisées. Le choix du vocabulaire d’adaptation, qui contient 136 mots, a fait l’objet d’une étude particulière… Cette étude montre également que la Q. V. Représente plus qu’un simple outil pour réduire la quantité de données. Les répertoires qu’elle utilise permettent de caractériser les locuteurs, pour les systèmes de vérification du locuteur. Enfin, son efficacité pour l’adaptation au locuteur, offre aux systèmes de reconnaissance de grands vocabulaires, une solution intéressante au problème de la reconnaissance multi-locuteur.