Decodage acoustico-phonetique : apport de la decomposition temporelle generalisee et de transformations spectrales non-lineaires. application a la reconnaissance des mots epeles en continu

by Claude Montacié

Doctoral thesis in Sciences appliquées

Under the supervision of Xavier Rodet.

defended on 1991

in Paris, ENST .

  • Alternative Title

    Acoustic phonetic decoding: generalized temporal decomposition and non-linear spectral transformation apports


  • Abstract not available

    keywords keywords


  • Abstract

    Le travail presente dans cette these se situe dans le cadre de la reconnaissance automatique de la parole continue. Il presente un protocole complet de decodage acoustico-phonetique, compose des modules permettant le passage du signal vocal a un treillis phonetique. Ce systeme utilise un modele original de l'evolution des parametres spectraux: la decomposition temporelle generalisee, c'est-a-dire etendue a une mesure de dissimilarite quelconque. La decomposition temporelle rend compte des aspects dynamiques et redondants du signal de parole pour localiser et calculer des cibles spectrales moins dependantes d'evenements locaux que les parametres originaux. Ce protocole de decodage acoustico-phonetique a ete applique a un corpus de mots epeles en mode continu. Il a permis d'obtenir un taux de decodage acousticophonetique de 70% au premier choix avec un taux d'insertiion de 20%. La comparaison avec les techniques les plus performantes, telles les machines de markov cachees, n'a pas donne des performances equivalentes sur ce meme corpus. L'extension de ce systeme dans un cadre pluri-locuteur, a entraine l'emploi de techniques d'adaptation au locuteur, celles-ci presentent les caracteristiques suivantes: le calcul de fonctions de transformation spectrale non-lineaires et le choix automatique du vocabulaire d'adaptation specifique de chaque locuteur. Ces techniques ont permis une augmentation du taux de decodage acoustico-phonetique de plus de 10% compare a ce que l'on peut obtenir en l'absence d'adaptation, pour un locuteur de test different de celui de reference

Consult library

Version is available as a paper

Informations

  • Annexes : 140 REF

Where is this thesis?

  • Library : Centre de recherche INRIA Nancy - Grand Est (Villers les Nancy). Service Information et Edition Scientifiques.
  • PEB tested
  • Odds : MONTACIE d
See the Sudoc catalog libraries of higher education and research.