Etude de la parametrisation du signal de parole a partir de representations en ondelettes

par Christophe Gérard

Thèse de doctorat en Sciences appliquées

Sous la direction de M. Baudry.

Soutenue en 1995

à Paris 11 .

    mots clés mots clés


  • Résumé

    L'etape de parametrisation consiste a representer le signal par un jeu de parametres reduit, pertinent et robuste. Face a la transformee de fourier a court terme, les representations en ondelettes presentent des proprietes interessantes pour parametriser le signal de parole. L'objet de notre travail est donc de determiner l'apport des representations en ondelettes en reconnaissance de parole. Afin de valider nos parametrisations dans des systemes de reconnaissance existants, nous nous sommes replaces dans le cadre de l'analyse a trames de taille fixe. L'ondelette de morlet s'avere particulierement adaptee au signal traite, de part sa repartition frequentielle adaptable ainsi que sa localisation temps-frequence minimale en vertu du principe d'incertitude. Les parametrisations realisees sont constituees d'un seul coefficient energetique dans chaque bande de frequence, et pour chaque fenetre d'analyse. Plusieurs variantes ont ete testees: coefficient moyen ou maximum, decomposition en ondelettes discretes ou continues, echelle frequentielle logarithmique ou psychoacoustique, maximums synchrones ou asynchrones, domaine spectral ou pseudo-cepstral. La conclusion de notre etude permet d'etablir que les parametrisations en ondelettes mises en uvre sont, au plus, aussi robustes que les mfcc (mel frequency cepstrum coefficients). Plus precisement, il ressort que le cadre operatoire employe est trop reducteur pour mettre en exergue l'apport attendu des representations en ondelettes dans le cadre de la parametrisation. Meme si des ameliorations peuvent etre apportees aux parametrisations realisees, le cadre operatoire de predilection des representations en ondelettes reste l'analyse a duree variable, ce qui necessitera de developper des systemes de reconnaissances avec des architectures specifiques


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 222 P.
  • Annexes : 120 REF.

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Accessible pour le PEB
  • Bibliothèque : Centre Technique du Livre de l'Enseignement supérieur (Marne-la-Vallée, Seine-et-Marne).
  • Disponible pour le PEB
  • Cote : TH2014-012511
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.