Variational bayesian methods for audio indexing

par Fabio Valente

Thèse de doctorat en Automatique, traitement du signal et des images

Sous la direction de Christian Wellekens.

Soutenue en 2005

à Nice .

  • Titre traduit

    Méthodes baysiennes variationnelles pour l'indexation de fichiers audio


  • Pas de résumé disponible.


  • Résumé

    Dans cette thèse, nous considérons un nouveau type de méthodes approximatives appelées Apprentissage Variationnel (connu aussi comme Apprentissage d'ensemble) qui offre une solution sous forme explicite mais approximative du problème de l'intégration des paramètres. La clé des méthodes variationnelles est le remplacement des distributions réelles mais inconnues des paramètres par des distributions approximées (distributions variationnelles) qui permettent de traiter la solution analytiquement. Evidemment l'efficacité de cette approche dépend de la qualité de ces distributions approximées. Nous étudions l'usage des techniques variationnelles dans une application d'indexation audio où la sélection des modèles est le problème principal. Le problème de l'indexation audio consiste à regrouper les parties d'un enregistrement possédant des caractéristiques semblables. En particulier, nous considérons ici le cas où les données provenant d'un même locuteur doivent être regroupées. Le problème de la sélection du modèle est central dans de telles applications car le nombre de groupes (locuteurs) n'est généralement pas connu a priori et doit être estimée à partir des données. L'approche la plus courante de ce problème utilise une approximation très grossière de l'intégrale bayesienne pour la sélection du modèle qui n'est valable qu'asymptotiquement.


  • Résumé

    In this thesis we discuss a new type of approximated methods called Variational Learning (a. K. A. Ensemble Learning) that allow an approximated close form solution to the parameter integration problem. The key of Variational methods is the replacement of real unknown parameter distributions with approximated distributions (Variational distributions) that permits an analytical tractability of the solution. Obviously the effectiveness of this approach depends on how close the approximated distributions are to real distributions. We investigate the use of Variational techniques in an audio indexing task in which model selection is a main problem. Audio indexing problems in fact consists in clustering together part of the audio file with the same acoustic characteristic. In particular we consider here the case in which data coming from the same speaker must be clustered. The model selection problem is a central issue in those applications because the cluster (speaker) number is generally not a priori known and must be estimated by data. The most popular approach to this problem uses a veryprimitive approximation of the integral for the model selection task that is actually true only asymptotically.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. ( 168 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 157-168. Résumé en anglais

Où se trouve cette thèse ?

  • Bibliothèque : Université Nice Sophia Antipolis. Service commun de la documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : 05NICE4037
  • Bibliothèque : Université Nice Sophia Antipolis. Service commun de la documentation. Section Sciences.
  • Non disponible pour le PEB
  • Cote : 05NICE4037bis
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.