Towards modelling energetic masking for speech intelligibility in cocktail party situations - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2021

Towards modelling energetic masking for speech intelligibility in cocktail party situations

Vers la prédiction du masquage énergétique pour l’intelligibilité de la parole dans les situations de cocktail party

Résumé

This PhD project aimed towards developing a speech intelligibility model that could account for energetic effects of speech masked by speech, in particular the contribution of F0-based effects. Several previous studies showed an effect of F0 differences and/or an influence of harmonicity on speech-on-speech masking, although it is not clear what mechanisms underlie these effects. Mechanisms, such as spectral glimpsing and harmonic cancellation, have been proposed to explain F0 segregation, but their relative contributions and ability to predict behavioral data have not been explored. This present work presents the implementation of harmonic cancellation into an existing speech intelligibility model. The proposed model was able to accurately predict speech intelligibility against harmonic complexes varying in F0 contour, location and temporal envelope. A behavioral experiment was conducted to investigate the potential role of harmonic cancellation in masked speech intelligibility. In addition to the comparison of SRTs across masking conditions, the ability of the model to capture variations in the SRTs, and the contribution of harmonic cancellation to the predictions, provided more insights into the role of harmonic cancellation in cocktail party scenarios.
Ce projet de thèse vise à développer un modèle d'intelligibilité de la parole capable de prendre en compte les effets énergétiques dans les situations présentant des sources concurrentes de parole, en particulier la contribution des effets liés à la fréquence fondamentale (F0). Plusieurs études ont montré un effet des différences de F0 et/ou une influence de l'harmonicité sur le masquage de la parole par la parole. Les mécanismes sous-jacents ne sont cependant pas complètement connus. Des mécanismes, tels que le « spectral glimpsing » et « l’harmonic cancellation », ont été proposés pour expliquer la ségrégation par F0, mais leurs contributions relatives et leur capacité à prédire les données comportementales n'ont pas été explorées. Cette thèse présente l'implémentation de l’harmonic cancellation dans un modèle d'intelligibilité de la parole. Le modèle proposé est capable de prédire avec précision l'intelligibilité de la parole en présence de complexes harmoniques présentant des différences d’intonation, de localisation et d’enveloppe temporelle. Une expérience a été menée afin d’étudier le rôle de l’harmonic cancellation dans les situations présentant des sources concurrentes de parole. La comparaison des seuils de réception de la parole pour différents types de masqueurs, ainsi que la capacité du modèle à capturer les variations d’intelligibilité et la contribution de l’harmonic cancellation dans les prédictions ont permis de mieux comprendre le rôle de l’harmonic cancellation dans les situations de cocktail party.
Fichier principal
Vignette du fichier
Prudhomme_PhD_thesis_2021.pdf (1.59 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03620230 , version 1 (25-03-2022)

Identifiants

  • HAL Id : tel-03620230 , version 1

Citer

Luna Malka Prud'Homme. Towards modelling energetic masking for speech intelligibility in cocktail party situations. Acoustics [physics.class-ph]. Université de Lyon, 2021. English. ⟨NNT : 2021LYSET007⟩. ⟨tel-03620230⟩
85 Consultations
56 Téléchargements

Partager

Gmail Facebook X LinkedIn More