Analyse modale de sons d'impact par méthodes haute résolution pour la catégorisation perceptive des matériaux.

par Adrien Sirdey

Thèse de doctorat en Acoustique

Sous la direction de Richard Kronland-Martinet et de Olivier Derrien.

Le président du jury était Kristoffer Jensen.

Le jury était composé de Olivier Derrien.

Les rapporteurs étaient Sylvain Marchand, Philippe Depalle.


  • Résumé

    Faire le lien entre la morphologie d'un signal sonore et certains de ses attributs perceptifs est une étape capitale dans l'élaboration d'un synthétiseur proposant un contrôle intuitif. Certains aspects de cette morphologie peuvent être caractérisés au moyen de "descripteurs acoustiques". Lorsqu'ils sont choisis judicieusement, ces descripteurs permettent de classer des signaux dans des catégories ayant un sens perceptif ; ceci permet d'établir un lien entre morphologie et perception. Dans le travail présenté ici, on s'intéresse en particulier à la catégorisation perceptive de sons d'impact.La plupart des descripteurs considérés ici se construisent à partir d'une modélisation paramétrique du signal. Dans notre cas, la modélisation la plus appropriée semble être la décomposition en somme de sinusoïdes amorties. Une estimation stable et rigoureuse des paramètres du modèle étant essentielle au calcul des descripteurs, on se penche sur la comparaison de plusieurs méthodes de décomposition. Il ressort que la méthode à haute résolution ESPRIT semble la plus indiquée, mais qu'elle ne peut pas être utilisée sous sa forme classique. On propose donc différentes adaptations. En particulier, on s'intéresse à l'application d'ESPRIT dans des repères de Gabor. En outre, on propose des méthodes pour maximiser le caractère parcimonieux de la décomposition.On étudie finalement un cas d'application concret : à partir d'une banque de sons enregistrés en chambre anéchoïque résultant d'impacts sur divers objets du quotidien, on évalue la pertinence d'un ensemble de descripteurs pour la catégorisation en fonction du matériau perçu.


  • Résumé

    Linking an audio signal morphology with some of its perceptual attributes is a key step when elaborating a intuitively controlled synthesizer. Some of these morphology aspects can be characterized using "acoustical descriptors". When chosen wisely, descriptors can allow a classification of audio signals in categories which are perceptually relevant ; in such cases, this approach establishes a link between morphology and perception. The present work focuses on the perceptual categorization of impact sounds.Most of the descriptors proposed here are computed using a parametrized description of the signal. Here, the most appropriate parametrization seems to be a decomposition in exponentially damped sinusoids. A robust and stable estimation of the model parameters being essential to the computation of relevant descriptors, different parametrization methods are described and compared. From these comparisons, it appears that the high-resolution method ESPRIT is the most appropriate, but that it cannot be applied in its classical form. Several adaptations are therefore investigated. In particular, the application of ESPRIT in Gabor frames is considered. Besides, a method is proposed in order to minimize the number of components necessary for a satisfactory decomposition.Finally, a concrete application is addressed : from an impact sounds bank recorded in an anechoic chamber, elaborated with a wide range of everyday-life objects, the relevance of several acoustical descriptors for the perceptual categorization of the perceived material is investigated.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?