Inference dynamique de chaines de markov cachees appliquee a la reconnaissance multilocuteur en milieu bruite

par SANDRA DUFOUR

Thèse de doctorat en Traitement du signal et des télécommunications

Sous la direction de Bernard Delyon.

Soutenue en 1998

à Rennes 1 .

    mots clés mots clés


  • Résumé

    La reconnaissance de parole connait aujourd'hui un essor formidable. Les modeles de markov caches ont prouve leur efficacite, cependant les diverses evolutions de ces modeles peuvent apporter beaucoup en prenant mieux en compte la nature meme du signal de parole. Le telephone de voiture est largement utilise pour acceder a des services, mais cet acces peut se reveler dangereux. Dialoguer avec un systeme par des appuis successifs sur des touches tout en conduisant necessite une concentration supplementaire de la part de l'utilisateur. Un systeme de reconnaissance vocale permettrait donc d'ameliorer sensiblement ce dialogue. Notre attention s'est portee sur la reconnaissance vocale en mode multilocuteur, pour des conditions d'environnement principalement bruitees. Deux types de perturbations sont envisagees : celle induite par le bruit voiture, et celle du canal de transmission telephonique. Dans l'optique de systemes de reconnaissance pour la telephonie mobile, nous etudions egalement les performances du systeme soumis au codage gsm. Une etude comparative des performances obtenues avec une approche centiseconde classique et une approche segmentale est menee afin de montrer l'interet que peut avoir l'introduction des connaissances sur les stationnarites du signal. Dans le cadre des grands vocabulaires, la reconnaissance phonetique semble la mieux adaptee et permet de creer de nouveaux modeles de mots. L'influence du contexte n'est pas negligeable et nous mettons en valeur les differentes influences des phonemes sur leur voisin selon leur classe d'appartenance. L'introduction du contexte, permet de prendre en compte l'effet de coarticulation et d'ameliorer la robustesse du systeme. Enfin, l'aboutissement de ces travaux montre l'interet que peut avoir l'adaptation de la topologie des modeles aux mots dans le but d'affiner la reconnaissance. Ceci est realise par l'introduction de l'inference des modeles de markov, qui genere un graphe specifique a chaque mot.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 245 P.
  • Annexes : 150 REF.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Rennes I. Service commun de la documentation. Section sciences et philosophie.
  • Disponible pour le PEB
  • Cote : TA RENNES 1998/44
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.