Études d'algorithmes d'extraction des informations de spatialisation sonore : application aux formats multicanaux

par Manuel Briand

Thèse de doctorat en Signal, image, parole, télécoms

Sous la direction de Nadine Martin.

Soutenue en 2007

à Grenoble, INPG , en partenariat avec Grenoble Images Parole Signal Automatique (laboratoire) .


  • Résumé

    La première orientation de ce travail de thèse vise à améliorer les performances des méthodes de codage audio paramétrique basées sur les indices de la localisation auditive. Nous avons cherché à adapter l'extraction des paramètres au contenu fréquentiel des signaux. La seconde orientation des travaux établie une modélisation des signaux multicanaux pour proposer une alternative au schéma de codage paramétrique actuel. Nous présentons une interprétation et l'évaluation des performances de l'Analyse en Composante Principale, réalisée en temps et en sous-bandes de fréquences avec une approche paramétrique. Finalement, nous utilisons cette décomposition au sein d'une nouvelle méthode de codage paramétrique qui repose à la fois sur la concentration de l'information dominante et sur l'extraction de paramètres pertinents. Les performances de notre méthode de codage paramétrique sont évaluées pour le cas stéréophonique et une extension au codage de signaux au format 5. 1 est proposée.


  • Résumé

    The first axis of this thesis aims at improving the performances of parametric coding methods based on the auditory localization cues. We have looked further into adapt the parameter extraction to the spectral components of audio signals. The second axis of this work established a multichannel audio model in order to propose an alternative to existing parametric coding schemes. We present an interpretation and the performance evaluation of the Principal Component Analysis, carried out both in time and frequency subbands with a parametric approach. Finally, we use this decomposition within a new parametric coding method which relies on the concentration of dominant sound sources and the extraction of relevant parameters. The performances of our parametric coding method are evaluated for the stereophonic case and an extension for parametric coding of 5. 1 signals is proposed.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (208 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. [209-220]

Où se trouve cette thèse ?

  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Disponible pour le PEB
  • Cote : TS07/INPG/0027/D
  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Disponible sous forme de reproduction pour le PEB
  • Cote : TS07/INPG/0027
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.