Thèse soutenue

Etude du modèle sinusoïdes et bruit pour le traitement des signaux de parole estimation robuste de l'enveloppe spectrale
FR
Accès à la thèse
Auteur / Autrice : Marine Campedel Oudot
Direction : Éric Moulines
Type : Thèse de doctorat
Discipline(s) : Chimie
Date : Soutenance en 1998
Etablissement(s) : Paris, ENST

Résumé

FR

Le modèle dit sinusoïdes et bruit fait l'objet de nombreuses études depuis des dizaines d'années. Il représente la parole voisée comme une somme de sinusoïdes dont les paramètres varient lentement au cours du temps et la parole bruitée par une composante aléatoire. C'est un modèle mathématique qui peut trouver une justification à travers des modèles simplifies de production de la parole. Le modèle sinusoïdes et bruit est particulièrement adapte à des applications aussi diversifiées que le codage a bas débit ou les transformations prosodiques hautes qualités. En effet, sa représentation paramétrique facilite la quantification ; en outre l'accès immédiat a des grandeurs prosodiques (telles que la hauteur de la voix) permet de modifier facilement les sons. Cependant, les performances du modèle sont fortement liées aux techniques d'analyse et de synthèse des paramètres et bien souvent les modèles sinusoïdaux ne supplantent pas leurs concurrents dans les applications susnommées. Notre étude concerne tout d'abord les techniques usuelles d'analyse et de synthèse. Considérant des défauts au niveau de l'estimation de l'enveloppe spectrale, nous introduisons une nouvelle méthode d'estimation reposant sur un critère de maximum de vraisemblance. Une description complète théorique et pratique est effectuée. Enfin le modèle est applique au codage a bas débit (< 4kbps), au de bruitage et a la synthèse. Dans chacune des applications nous mettons en évidence les adaptations à effectuer et nous apportons des éléments améliorant la qualité sonore.