Decodage acoustico-phonetique : apport de la decomposition temporelle generalisee et de transformations spectrales non-lineaires. application a la reconnaissance des mots epeles en continu

par Claude Montacié

Thèse de doctorat en Sciences appliquées

Sous la direction de Xavier Rodet.

Soutenue en 1991

à l'ENST .

    mots clés mots clés


  • Résumé

    Le travail presente dans cette these se situe dans le cadre de la reconnaissance automatique de la parole continue. Il presente un protocole complet de decodage acoustico-phonetique, compose des modules permettant le passage du signal vocal a un treillis phonetique. Ce systeme utilise un modele original de l'evolution des parametres spectraux: la decomposition temporelle generalisee, c'est-a-dire etendue a une mesure de dissimilarite quelconque. La decomposition temporelle rend compte des aspects dynamiques et redondants du signal de parole pour localiser et calculer des cibles spectrales moins dependantes d'evenements locaux que les parametres originaux. Ce protocole de decodage acoustico-phonetique a ete applique a un corpus de mots epeles en mode continu. Il a permis d'obtenir un taux de decodage acousticophonetique de 70% au premier choix avec un taux d'insertiion de 20%. La comparaison avec les techniques les plus performantes, telles les machines de markov cachees, n'a pas donne des performances equivalentes sur ce meme corpus. L'extension de ce systeme dans un cadre pluri-locuteur, a entraine l'emploi de techniques d'adaptation au locuteur, celles-ci presentent les caracteristiques suivantes: le calcul de fonctions de transformation spectrale non-lineaires et le choix automatique du vocabulaire d'adaptation specifique de chaque locuteur. Ces techniques ont permis une augmentation du taux de decodage acoustico-phonetique de plus de 10% compare a ce que l'on peut obtenir en l'absence d'adaptation, pour un locuteur de test different de celui de reference


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Annexes : 140 REF

Où se trouve cette thèse ?

  • Bibliothèque : Centre de recherche INRIA Nancy - Grand Est (Villers les Nancy). Service Information et Edition Scientifiques.
  • PEB soumis à condition
  • Cote : MONTACIE d
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.