Utilisation de modeles de markov caches pour une compensation synchrone a la trame, dans un contexte de reconnaissance de la parole

par LIONEL DELPHIN POULAT

Thèse de doctorat en Sciences et techniques

Sous la direction de Régine André-Obrecht.

Soutenue en 1999

à Rennes 1 .

    mots clés mots clés


  • Résumé

    Une bonne partie des degradations des performances des systemes de reconnaissance fondes sur des modeles statistiques (modeles de markov caches) est due a la difference entre les donnees utilisees pour l'apprentissage et les donnees perturbees que l'on doit reconnaitre. Afin de diminuer l'effet des perturbations, il faut modeliser le signal et les perturbations. Les differences peuvent alors etre compensees. Suivant les modeles choisis, cette compensation peut se faire dans l'espace du signal, des parametres acoustiques ou dans celui des parametres du modele. Dans cette etude, on examine des perturbations qui evoluent au cours du temps, une adaptation locale est realisee. Les modeles de markov caches, utilises pour la reconnaissance constituent le modele de reference du signal de parole et la compensation est modelisee une fonction parametrique. Les observations de ces modeles (trames acoustiques) sont les vecteurs cepstraux. La mise a jour des parametres est synchrone a l'arrivee d'une nouvelle trame acoustique. Deux estimateurs sont etudies. Le premier repose sur un algorithme expectation maximization recursif. Le deuxieme est derive au sens du maximum de vraisemblance ou du maximum a posteriori le long de chaque sequence d'etats possible dans le modele de markov cache. Les deux estimateurs peuvent etre utilises au cours du processus de reconnaissance de la parole. Trois fonctions de compensation sont etudiees d'un point de vue theorique : la compensation d'un biais, une transformation affine dans l'espace cepstral et la soustraction spectrale. Des experiences de reconnaissance de la parole sont menees sur des bases de donnees enregistrees sur le reseaux telephoniques fixe et cellulaire. Dans ces evaluations, le deuxieme estimateur est retenu pour des raisons pratiques. Les experiences montrent l'efficacite des compensations synchrones a la trame pour compenser de fortes differences entre les donnees d'apprentissage et les donnees a reconnaitre.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : (166 p.)
  • Annexes : Notes bibliogr.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Rennes I. Service commun de la documentation. Section sciences et philosophie.
  • Disponible pour le PEB
  • Bibliothèque : Centre de recherche INRIA Nancy - Grand Est (Villers les Nancy). Service Information et Edition Scientifiques.
  • PEB soumis à condition
  • Cote : DELPHIN-POULAT u
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.