Quelques contributions au traitement statistique du signal et applications au débruitage audio et à la localisation des mobiles

par Mahdi Triki

Thèse de doctorat en Signal et images

Sous la direction de Dirk Slock.

Soutenue en 2007

à Paris, ENST .


  • Résumé

    Un processus aléatoire est un modèle mathématique qui décrit un phénomène qui évolue d'une façon imprévisible. Si des informations a priori, sur la structure ou les statistiques du signal, sont disponibles les performances du traitement statistique augmentent significativement. Nous étudions trois types d'a priori : spectrale, spatiale, et statistique; et nous considérons particulièrement des applications au débruitage audio et à la localisation des mobiles. D'abord, nous étudions la représentation structurale du signal audio. Le modèle proposé exploite les corrélations tempofréquentielless du signal audio. Nous avons appliqué notre modèle au débruitage audio la séparation audio sous-déterminée. Les résultats expérimentaux montrent que l'approche proposée convient à l'analyse des signaux de musiques et de la parole, et produisent de bons résultats auditifs. Ensuite, nous étudions le dereverberation aveugle des signaux audio. Nous proposons un égaliseur basé sur la prédiction linéaire, exploitant les diversités spatiales, temporelles, et spectrales. Les simulations prouvent que l'égaliseur proposé surpasse le filtre spatial classique. La dernière partie de la thèse se concentre sur l'estimation Bayésienne des paramètres. Nous introduisons le concept d'estimation conditionnellement non-biaisé par morceau, pour laquelle la contrainte du biais concerne un paramètre à la fois. De cette manière, chaque paramètre est traité comme déterministe tandis que les autres paramètres sont traités comme Bayésiens. Une introduction plus générale du concept est motivée par l'estimation LMMSE des canaux, pour laquelle les implications du concept sont illustrées dans diverses manières.

  • Titre traduit

    Some contributions to statistical signal processing and applications to audio enhancement and mobile localization


  • Résumé

    A random or stochastic process is a mathematical model for a phenomenon that evolves in an unpredictable manner. If prior information on the signal structure or statistics is available, the accuracy of the statistical signal processing significantly increases by an appropriate exploitation of such prior. We investigate three kinds of prior: spectral, spatial, and statistical information. First, we investigate the structural representation of audio signals. The proposed model exploits both the sparsity and the time-frequency correlation of the audio signal. We have considered the application of our model to audio enhancement and separation. Simulations reveal that the proposed approach is suitable for the analysis of music and speech signals and outperforms the classic matching pursuit schemes in terms of separation accuracy and robustness. Then, we investigate blind dereverberation of audio signals. A multichannel linear prediction based equalizer is proposed, exploiting spatial, temporal, and spectral diversities. Simulations show that the proposed equalizer outperforms the classic beamformer. The last part of the thesis focuses on Bayesian parameter estimation. Classical Bayesian approaches lead to useful MSE reduction, but they also introduce a bias (often annoying for several applications). We introduce the concept of Component-Wise Conditionally Unbiased parameter estimation, in which unbiasedness is forced for one parameter at a time. The more general introduction of the CWCU concept is motivated by LMMSE channel estimation, for which the implications of the concept are illustrated in various ways. Application to mobile localization is investigated in more details.

Autre version

Cette thèse a donné lieu à une publication en 2008 par École nationale supérieure des télécommunications à Paris

Quelques contributions au traitement statistique du signal et applications au débruitage audio et à la localisation des mobiles


Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (305 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : 213 réf. bibliogr.

Où se trouve cette thèse ?

  • Bibliothèque : Télécom ParisTech. Bibliothèque scientifique et technique.
  • Disponible pour le PEB
  • Cote : 7.21 TRIK
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.
Cette thèse a donné lieu à 1 publication .

Consulter en bibliothèque

Cette thèse a donné lieu à une publication en 2008 par École nationale supérieure des télécommunications à Paris

Informations

  • Sous le titre : Quelques contributions au traitement statistique du signal et applications au débruitage audio et à la localisation des mobiles
  • Dans la collection : ENST , 2007E027 , 0751-1353
  • Détails : 1 vol. (XXVI-273 p.)
  • Annexes : Bibliogr. p. 251-273
La version de soutenance de cette thèse existe aussi sous forme papier.

Où se trouve cette thèse ?

Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.