Towards a binaural model for predicting speech intelligibility among competing voices in rooms

par Thibaud Leclère

Thèse de doctorat en Acoustique

Le président du jury était Christian Lorenzi.

Le jury était composé de Olivier Macherey, Etienne Parizet.

Les rapporteurs étaient Christian Lorenzi, Torsten Dau.

  • Titre traduit

    Vers un modèle binaural pour prédire l'intelligibilité de la parole dans les salles en présence de voix concurrentes


  • Résumé

    Ce travail de thèse vise à proposer un modèle pouvant prédire l’intelligibilité d’une voix cible masquée par des sources concurrentes dans les salles. Un modèle a déjà été développé par Lavandier et Culling (2010) et est capable de prédire l’intelligibilité d’une cible en champ proche perturbée par plusieurs sources de bruit. Le travail présenté ici traite des nouvelles implémentations et expérimentations nécessaires pour étendre le modèle au cas de cibles distantes et au cas de voix concurrentes, qui présentent des propriétés acoustiques différentes des bruits stationnaires (fluctuation d’enveloppe, fréquence fondamentale, modulations de fréquence fondamentale). L’effet nuisible de la réverbération sur la parole cible a été implémenté avec succès. Cette nouvelle version du modèle permet une interprétation unifiée de plusieurs effetsperceptifs observés dans la littérature mais il présente une dépendance de la salle, ce qui limite son aspect prédictif. Des travaux expérimentaux ont été menés pour déterminer comment le modèle pourrait prendre en compte le cas de sources cibles et masquantes avec des spectres différents ainsi que le cas où plusieurs mécanismes auditifs opèrent simultanément (ségrégation par F0, démasquage spatialet écoute dans les creux de modulation).


  • Résumé

    This PhD work aims to propose a model predicting the perceived intelligibility of a target speech masked by competing sources in rooms. An existing model developed by Lavandier and Culling (2010) is already able to predict speech intelligibility of a near-field target in the presence of multiple noise sources. The present work deals with new implementations and experimental work needed to extend the model tothe case of a distant target and to the case of masking voices, which present different acoustical properties than noises (envelope fluctuations, fundamental frequency, modulations of fundamental frequency). The detrimental effect of reverberation on the target speech has been successfully implemented. This new version of the model provides a unified interpretation of several perceptual effects previously observed in the literature but it presents a room dependency which limits its predictive power. Experimental work has been conducted to determine how the model could account for sources presenting different spectra, and to account for several auditory mechanisms operating simultaneously (F0 segregation, spatial unmasking and temporal dip listening).


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Ecole nationale des travaux publics de l'Etat. Bibliothèque.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.