Toward sequential segregation of speech sounds based on spatial cues

Marion David

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Vers la ségrégation séquentielle de signaux de parole sur la base d'indices de position

FR |

EN

Auteur / Autrice :	Marion David
Direction :	Nicolas Grimault, Mathieu [Nicolas Jacky] Lavandier
Type :	Thèse de doctorat
Discipline(s) :	Acoustique
Date :	Soutenance le 13/11/2014
Etablissement(s) :	Vaulx-en-Velin, École nationale des travaux publics de l’État
Ecole(s) doctorale(s) :	École doctorale Mécanique, Energétique, Génie Civil, Acoustique (Villeurbanne ; 1993-....)
Partenaire(s) de recherche :	Laboratoire : Laboratoire génie civil et bâtiment (Vaulx-en-Velin, Rhône) - Centre de Recherche en Neurosciences de Lyon (Bron ; Saint-Priest-en-Jarez ; 2011-....)
Jury :	Président / Présidente : Jean-Christophe Valière
	Examinateurs / Examinatrices : Catherine Marquis-Favre, Andrew J. Oxenham
	Rapporteurs / Rapporteuses : Daniel Pressnitzer, Steven Van de Par

Mots clés

FR |

EN

Mots clés libres

Analyse de scènes auditives

Ségrégation séquentielle

Différences spatiales

Indices de position

Signaux de parole

Résumé

FR |

EN

Dans un contexte sonore constitué de plusieurs sources sonores, l’analyse de scène auditive a pour objectif de dresser une représentation précise et utile des sons perçus. Résoudre ce type de scènes consiste à regrouper les sons provenant d’une même source et de les séparer des autres sons. Ce travail de thèse a eu pour but d’approfondir nos connaissances du traitement de ces scènes auditives complexes par le système auditif. En particulier, il s’agissait d’étudier l’influence potentielle des indices spatiaux sur la ségrégation. Une attention particulière a été portée tout au long de cette thèse pour intégrer des éléments réalistes dans toutes les études menées. Dans un environnement réel, la salle et la tête entraînent des distorsions des signaux de parole en fonction des positions de la source et du récepteur. Ce phénomène est appelé coloration. Comme première approximation de la parole, des bruits avec un spectre de parole ont été utilisés pour évaluer l’effet de la coloration. Les résultats ont montré que les fines différences spectrales monaurales induites par la coloration due à la tête et à la salle peuvent engendrer de la ségrégation. De plus, cette ségrégation peut être renforcée en ajoutant les indices binauraux associés à une position donnée (ILD, ITD). En particulier, une deuxième étude a suggéré que les variations monaurales d’intensité au cours du temps à chaque oreille étaient plus utiles pour la ségrégation que les différences interaurales de niveau. Les résultats ont également montré que le percept de latéralisation, associé à un ITD donné, favorise la ségrégation lorsque ce percept est suffisamment saillant. Par ailleurs, l’ITD per se peut induire de la ségrégation. La capacité naturelle à résoudre perceptivement une scène auditive est pertinente pour l’intelligibilité de la parole. L’objectif était de répliquer ces premières expériences, donc évaluer l’influence des indices spatiaux sur la ségrégation de signaux de parole à la place de bruits gelés. Une caractéristique de la parole est la grande variabilité de ses paramètres acoustiques qui permettent de transmettre de l’information. Ainsi, la première étape a été d’étudier dans quelle mesure la ségrégation basée sur une différence de fréquence peut être influencée par l’introduction de variabilité spectrale au sein des stimuli. L’étape suivante a été d’évaluer la différence de fréquence fondamentale requise pour séparer des flux de parole. En effet, il a été supposé que des indices de position pourraient être utiles pour renforcer la ségrégation basée sur un indice plus robuste comme une différence de F0 du fait de leur stabilité au cours du temps dans des situations réelles. Les résultats de ces expériences préliminaires ont montré que l’introduction d’une large variabilité spectrale au sein de flux de sons purs pouvait entraîner un percept compliqué, probablement constitué des multiples flux sonores. De plus, les résultats ont indiqué qu’une différence de F0 comprise entre 3 et 5 demi-tons permettait de séparer des signaux de parole. Les résultats de ces expériences pourront être utilisés pour concevoir la prochaine expérience visant à étudier dans quelle mesure un percept ambigu peut évoluer vers de la ségrégation par l’introduction d’indices de position.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Vers la ségrégation séquentielle de signaux de parole sur la base d'indices de position

Mots clés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Vers la ségrégation séquentielle de signaux de parole sur la base d'indices de position

Mots clés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses