Thèse de doctorat en Signal, image, parole, télécoms
Sous la direction de Gérard Bailly.
Soutenue en 2003
à Grenoble INPG , en partenariat avec Institut de la communication parlée (Grenoble ; 1983-2007) (laboratoire) .
Cette thèse traite de la génération automatique de la prosodie en vue de la synthèse de la parole à partir de texte. Nous partons de l'hypothèse que la prosodie encode dans le signal acoustique les instances de fonctions (para-)linguistiques (hiérarchisation, segmentation, attitudes etc. ) par des contours multiparamétriques dont l'étendue égale la portée des fonctions. Ces contours interagissent par superposition additive. Nous proposons un modèle, le SFC "Superposition of Functional Contours", qui réalise la factorisation de réalisations prosodiques en contours à l'aide d'une analyse par la synthèse. La décomposition obtenue est optimale par rapport à un ensemble de données (corpus) au sens où la forme des contours relève uniquement des besoins statistiques sous les contraintes fonctionnelles que nous imposons. Le SFC a été appliqué à des corpora d'oralisation de formules mathématiques et de phrases isolées en français. Il a été également appliqué à l'allemand et au galicien.
SFC : superposition of functional contours. A model for automatic prosody generation
Pas de résumé disponible.