Extraction d'information rythmique à partir d'enregistrements musicaux

par Miguel Alonso Arevalo

Thèse de doctorat en Signal et images

Sous la direction de Gaël Richard et de Bertrand David.

Soutenue en 2006

à Paris, ENST .


  • Résumé

    L'objectif de cette thèse est la recherche d'outils de détection et de reconnaissance de la structure rythmique d'un morceau de musique. Il'existe de nombreuses applications nécessitant cette information : la transcription musicale par ordinateur, le "music information retrieval", l'édition musicale. L'axe principal du travail de recherche a consisté en le développement de techniques pour l'estimation des paramètres rythmiques tels que les cadences et la localisation de beats. Parmi les originalités de ce travail de recherche, nous avons proposé de effectuer l'analyse rythmique de façon séparée sur la partie déterministe du signal musical (contenant les sons harmoniques) et sur la partie stochastique (contenant le signal résiduel après extraire la partie harmonique du son original). Nous avons proposé un algorithme robuste pour détecter les attaques (onsets) des signaux musicaux. Celui ci est basé sur le concept du flux énergétique spectral, i. E. , le taux auquel l'énergie du contenu fréquentiel du signal audio change à un instant donné. Une autre originalité de ce travail consiste en l'utilisation d'un algorithme de programmation dynamique modifié pour suivre simultanément plusieurs trajectoires rythmiques à l'intérieur d'un signal musical. L'efficacité du système a été validé sur une base de données comportant 1435 morceaux musicaux appartenant à une dizaine de genres. Les algorithmes développés ont été soumis à évaluation dans le cadre du concours international "Music Information Retrieval Evaluation eXchange" (MIREX) dans la catégorie de "tempo extraction" et dans la l'édition 2005 un des algorithmes obtenu la première place parmi plus d'une douzaine de participants.

  • Titre traduit

    Extraction of metrical information from acoustic music signals


  • Résumé

    This dissertation presents work on the development of tools for the automated analysis of music signals, more exactly it proposes a number of techniques to identify and examine the fundamental elements of musical rhythm. There exist many applications requiring rhythmic information, for example automatic music transcription, music information retrieval, audio special effects, audio editing. The main research axis was the development of techniques to estimate rhythmic parameters of music such as beat rates and beat localizations at two different metrical levels: the tatum and the tactus (or tempo). In this work, we have proposed to carry out the analysis after separating the audio signal in a deterministic part (containing the harmonic sounds) and the stochastic part (containing the residual signal after extracting the harmonics from the original signal). We exploited the principle of the so-called Spectral Energy Flux, i. E. , the rate of change of the power spectrum as a function of time, to develop an effective algorithm to estimate the amount of musical stress at a given time. We have also presented a technique based on the dynamic programming algorithm that was specially conceived to track simultaneously the course of several rhythmic trajectories through time. The effectiveness of the system was validated using a database comprising 1435 musical pieces and covering ten musical genres. The algorithms was also submitted to external evaluation within the framework of the international contest "Music Information Retrieval Evaluation eXchange" in the category of "tempo extraction", and in the 2005 obtained the first place among more than twelve submissions.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (192 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : 161 réf. bibliogr. Résumé étendu en français

Où se trouve cette thèse ?

  • Bibliothèque : Télécom ParisTech. Bibliothèque scientifique et technique.
  • Disponible pour le PEB
  • Cote : 7.213 ALON
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.