Systèmes de reconnaissance de la parole revisités : réseaux bayésiens dynamiques et nouveaux paradigmes

par Murat Deviren

Thèse de doctorat en Informatique

Sous la direction de Jean-Paul Haton.


  • Résumé

    Dans cette thèse nous élaborons quatre composantes fondamentales d'un système de reconnaissance automatique de la parole : la modélisation acoustique, la modélisation du langage, la paramétrisation du signal acoustique et la compensation du bruit. Nous proposons des techniques nouvelles dans chacun de ces domaines, et nous apportons des perspectives novatrices. Nous traitons les problèmes de modélisation acoustique et modélisation du langage avec un outil statistique puissant : les modèles probabilistes graphiques. Ce formalisme généralise la plupart des techniques probabilistes utilisées dans le traitement de la parole. La reformulation des modules de modélisation dans ce formalisme, nous ouvre de nouvelles perspectives inexploitées auparavant. En plus des nouvelles approches pour la modélisation, nous proposons également de nouvelles stratégies pour l'extraction des paramètres acoustiques. Notre motivation principale dans ce domaine est de chercher des paramètres robustes qui ne sont pas liés à la modélisation par des HMMs. Nous abordons aussi le problème de robustesse au bruit par adaptation des modèles acoustiques et nous proposons une nouvelle méthode de compensation prédictive supervisée.


  • Résumé

    In this thesis we focus on four principle components of a speech recognition system: acoustic modeling, language modeling, speech feature extraction and noise compensation. We propose novel modeling approaches for acoustic and linguistic modeling within the Bayesian networks formalism. Bayesian networks are a subset of probabilistic graphical models that include the most widely used probability models in speech recognition. Therefore rethinking the modeling problems in this formalism provides new perspectives that were not considered previously. Besides novel modeling approaches we also address new speech feature extraction schemes. Our main motivation in this direction is to seek for robust features that are not bound to be used in classical hidden Markov modeling (HMM) approach. Finally, we address the robustness problem for varying application conditions and propose a novel supervised compensation scheme.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : XX-190 p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 183-190

Où se trouve cette thèse ?

  • Bibliothèque : Université de Lorraine (Villers-lès-Nancy, Meurthe-et-Moselle). Direction de la Documentation et de l'Edition - BU Sciences et Techniques.
  • Disponible pour le PEB
  • Cote : SC N2004 161
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.