Estimation de fréquences fondamentales multiples : application à la séparation de signaux de parole et musique

par Julie Rosier

Thèse de doctorat en Traitement du signal

Sous la direction de Yves Grenier.

Soutenue en 2003

à Paris, ENST .


  • Résumé

    L'objet de cette thèse est l'étude du problème d'estimation de fréquences fondamentales multiples, pour des mélanges de parole et de musique dont le nombre de sources est inconnu. Dans le cadre de la parole, nous proposons une méthode itérative qui estime successivement les fréquences fondamentales. La nature "voisée/non-voisée" des mélanges est caractérisée par un modèle du type "sommes de sinusoi͏̈des harmoniques + bruit autorégressif". L'estimation consiste à maximiser un terme de Vraisemblance pénalisée qui permet également d'estimer le nombre de sources. Dans le cadre musical, nous proposons trois nouvelles méthodes qui estiment simultanément les fréquences fondamentales. Basées sur une classification des pics spectraux du mélange, elles diffèrent par leur technique de classification. Toutes permettent d'estimer le nombre de sources. Elles permettent également de prendre en compte les recouvrements spectraux entre notes et sont ainsi applicables au traitement d'accords musicaux.

  • Titre traduit

    Multipitch estimation methods for the separation of speech and musical signals


  • Résumé

    This thesis deals with the multipitch estimation problem for speech and musical mixtures where the number of sources is unknown. In the speech context, we propose an iterative method which successively estimates the pitches. The complex "voiced/unvoiced" nature of the mixtures is characterized by a two-part model which consists in "sums of harmonic sinusoids + autoregressive process". The pitch estimation is based on the maximization of a penalized likelihood term. This likelihood also allows to define a voicing detector used to estimate the number of sources. In the musical context, we propose three new methods which simultaneously determine the pitches. Based on a spectral peak classification of the mixture, they differ by the classification technique. All the methods allow to estimate the number of sources. Moreover they are able to take into account the spectral overlaps which characterize the musical mixtures and can be used on musical chords.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (214 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. 63 réf.

Où se trouve cette thèse ?

  • Bibliothèque : Télécom ParisTech. Bibliothèque scientifique et technique.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.