Thèse soutenue

Diagnostic et évaluation automatique de la qualité vocale à partir d'indicateurs hybride

FR  |  
EN
Auteur / Autrice : Adrien Leman
Direction : Etienne Parizet
Type : Thèse de doctorat
Discipline(s) : Acoustique
Date : Soutenance le 07/06/2011
Etablissement(s) : Lyon, INSA
Ecole(s) doctorale(s) : ED Mécanique, Energétique, Génie Civil, Acoustique de Lyon
Partenaire(s) de recherche : Laboratoire : LVA - Laboratoire Vibrations Acoustique (Lyon, INSA)
Jury : Président / Présidente : Alexander Raake
Examinateurs / Examinatrices : Etienne Parizet, Alexander Raake, Régine Le Bouquin-Jeannès, Christophe D'Alessandro, Julien Faure
Rapporteurs / Rapporteuses : Régine Le Bouquin-Jeannès, Christophe D'Alessandro

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Les opérateurs de télécommunications ont besoin de superviser en temps réel la qualité vocale des services qu'ils proposent. La qualité vocale peut être évaluée par tests subjectifs auprès d'utilisateurs; mais ces méthodes sont très coûteuses et peu adaptées à la supervision. Des modèles objectifs sont ainsi proposés afin de prédire la qualité vocale à moindre coût. Cette thèse propose un modèle de diagnostic et d’évaluation utilisant les informations disponibles au point de mesure : le modèle DESQHI (Diagnostic and Speech Quality using Hybrid Indicators). Il se distingue des modèles existants par deux caractéristiques principales. La première concerne la structure du cœur du modèle. Il est montré que la qualité vocale peut être représentée comme un phénomène multidimensionnel faisant intervenir trois dimensions perceptives correspondant à bruyance, codage de la parole et continuité. Cette structure permet de diagnostiquer la qualité vocale en identifiant les principales causes perceptives de sa dégradation. La deuxième caractéristique concerne le type d’indicateur utilisé pour représenter ces dimensions perceptives, à savoir l’utilisation d’indicateurs basés sur le signal et paramétriques. Les indicateurs basés sur le signal utilisent les informations numériques pour représenter les caractéristiques du signal (par exemple le rapport signal sur bruit qui donne une estimation du niveau sonore du bruit de fond). Les indicateurs paramétriques sont issus des statistiques du réseau (par exemple le pourcentage de pertes de paquets qui fournit une indication sur le niveau de discontinuité du signal de parole). L’utilisation d’indicateurs hybrides utilisant à la fois les informations du signal numérique et les statistiques du réseau permet d’améliorer les performances globales de la prédiction de la qualité vocale, comparativement aux modèles uniquement basés sur le signal (p. ex. modèle P.563) et aux modèles utilisant les indicateurs paramétriques (p. ex. modèle E).