Thèse soutenue

Contrôle gestuel de la prosodie et de la qualité vocale

FR  |  
EN
Auteur / Autrice : Sylvain Le Beux
Direction : Christophe d' Alessandro
Type : Thèse de doctorat
Discipline(s) : Physique. Traitement du signal
Date : Soutenance en 2009
Etablissement(s) : Paris 11
Partenaire(s) de recherche : autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne)

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

La génération de parole expressive constitue aujourd’hui l’un des nouveaux défis pour les synthétiseurs de parole. Un moyen direct de rendre la synthèse expressive, consiste à la contrôler en temps réel par les gestes d’un opérateur. Notre recherche s'est donc déroulée selon deux axes : d'une part, la modification prosodique de la hauteur et de la durée de parole enregistrée, et d'autre part, la synthèse de voyelles, à partir d’un modèle de source glottique. Concernant la modification prosodique, nous avons implémenté en temps réel un algorithme permettant la modification conjointe de la hauteur et de la durée d'une phrase de parole enregistrée. Grâce à cet outil, nous avons mené différentes expériences, visant à valider la possibilité de modifier la prosodie grâce au geste manuel. Nos expériences ont montré que l'on était capable, de reproduire avec précision une intonation donnée grâce au geste manuel. Le second axe de notre recherche s’est focalisé sur la réalisation d’un synthétiseur de voyelles, dont on peut modifier la qualité vocale. La première étape de la réalisation de notre synthétiseur a consisté à implémenter une version en temps réel de l’onde de débit glottique, ainsi que les apériodicités de la source vocale. Nous pouvons ainsi contrôler la fréquence fondamentale, l’effort vocal, la tension, le souffle, les apériodicités structurelles et les différents mécanismes laryngés. Une attention particulière a été apportée à la réalisation du phonétogramme, ainsi qu’aux correspondances perceptives entre les paramètres du modèle et les dimensions vocales. Notre étude permet d’envisager à terme la modification conjointe, interactive, des composantes prosodiques et de qualité vocale.