Méthodes de séparation aveugle de sources applicables à des signaux de parole

par Benoît Albouy

Thèse de doctorat en Traitement du signal

Sous la direction de Yannick Deville.


  • Résumé

    Différentes méthodes de séparation aveugle de sources (SAS) ont été proposées au cours de cette thèse, afin d'extraire en sortie des structures utilisées, une contribution de chacune des sources à l'aide uniquement des mélanges reçus. Nous avons tout d'abord développé deux approches de SAS à segmentation temporelle, avec des structures de séparation symétrique et asymétrique, afin de résoudre le problème de deux mélanges convolutifs de deux sources présentant des silences. Ces méthodes nécessitent une identification de filtres de séparation, réalisée à l'aide de rapports de densité spectrale de puissance, et une détection de zones temporelles mono-sources. Ces approches fournissent alors de bonnes performances lors de tests de cocktail party, de rehaussement de la parole et de reconnaissance automatique de la parole. Afin de réduire l'hypothèse précédente de parcimonie des sources, des approches à segmentation temps-fréquence (TF) ont ensuite été proposées pour N mélanges linéaires instantanés puis pour N mélanges à atténuations et retards. La détection de quelques zones TF mono-sources permet alors d'obtenir des performances très intéressantes pour des signaux non-stationnaires comme ceux de parole.

  • Titre traduit

    Blind source separation methods applicable to speech signals


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 202 p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 193-199

Où se trouve cette thèse ?

  • Bibliothèque : Université Paul Sabatier. Bibliothèque universitaire de sciences.
  • Disponible pour le PEB
  • Cote : 2004TOU30222
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.