Detection et identification des occlusives a l'aide de la transformee en ondelettes

par FRANCOIS MALBOS

Thèse de doctorat en Sciences appliquées

Sous la direction de Marc Baudry.

Soutenue en 1995

à Paris 11 .

    mots clés mots clés


  • Résumé

    Le travail presente dans cette these s'insere dans le cadre du decodage acoustico-phonetique de la parole. Dans ce cadre, deux etapes ont ete dissociees: la detection et la reconnaissance des occlusives du francais a l'aide de la transformee en ondelettes. Dans une etape de detection, nous avons cherche a approximer la barre d'explosion des occlusives par une impulsion. La validation de ce modele s'effectue en analysant les fonctions de correlation entre le module de la transformee en ondelettes du signal de parole et celui de l'ondelette analysante. Pour les occlusives sourdes (respectivement sonores), un taux de detection egal a 89,5% (respectivement 67,6%) est associe a un taux de fausses alarmes de 10,5% (respectivement 32,4%). L'interet de notre systeme de detection est double. Il permet d'une part, la localisation de la barre d'explosion avec une erreur comprise entre 0,2 ms et 1 ms selon la structure frequentielle de l'occlusive. D'autre part, il permet de mesurer le caractere plus ou moins impulsionnel de l'occlusive. Bien que robuste, le systeme de detection s'avere moins performant pour des signaux bruites. Une reduction prealable du niveau du bruit de fond n'ameliore pas systematiquement les taux de detection. Utilisant la detection de la barre d'explosion, le systeme de reconnaissance repose sur l'analyse statistique de la moyenne des coefficients d'ondelettes sur un support temporel egal a une milliseconde. Trois analyses ont ete evaluees: l'analyse discriminante, les arbres de segmentation et les arbres de vraisemblance maximale. L'analyse discriminante se caracterise par un taux d'identification superieure a 74% pour une reconnaissance contextuelle. De plus, elle permet de reconnaitre 70% des fausses detections du module de detection. En raison de l'evaluation et des performances de chacune de ces methodes, seuls les taux de reconnaissance de cette analyse sont compares a ceux de dix systemes decrits dans la litterature. Pour un intervalle de confiance egal a 99%, sept presentent des performances non significativement differentes. Cette comparaison demontre que le lissage frequentiel haute frequence de la transformee en ondelettes n'est pas comme on aurait pu le supposer, un handicap majeur pour la reconnaissance des occlusives sourdes

  • Titre traduit

    Detection and identification of stop consonants with the wavelet transform


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 200 P.
  • Annexes : 186 REF.

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Paris-Saclay. DIBISO. BU Orsay.
  • Accessible pour le PEB
  • Bibliothèque : Centre Technique du Livre de l'Enseignement supérieur (Marne-la-Vallée, Seine-et-Marne).
  • Disponible pour le PEB
  • Cote : TH2014-012129

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Université de Lille. Service commun de la documentation. Bibliothèque universitaire de Sciences Humaines et Sociales.
  • Non disponible pour le PEB
  • Cote : 1995PA112048
  • Bibliothèque : Université Paris-Est Créteil Val de Marne. Service commun de la documentation. Section multidisciplinaire.
  • PEB soumis à condition
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.