Génération automatique de la prosodie pour la synthèse à partir du texte

par Philippe Di Cristo

Thèse de doctorat en Sciences

Sous la direction de Jean Véronis.

Soutenue en 1998

à Aix-Marseille 1 .

    mots clés mots clés


  • Pas de résumé disponible.


  • Pas de résumé disponible.


  • Résumé

    Cette these a pour theme la problematique de la synthese vocale et propose de decrire la realisation de deux systemes complets de synthese de la parole a partir du texte. La visee ultime de notre etude est de produire un signal dont le niveau de qualite prosodique puisse etre comparable a celui d'une voix humaine. La qualite de la prosodie est en effet essentielle pour la comprehension, ainsi que pour l'acceptabilite de la synthese, en particulier dans le cas de longs textes lus. Notre objectif est egalement de contribuer a l'elaboration d'un systeme de synthese independant de la langue, bien que notre these soit consacree a la synthese du francais. Nous presentons donc dans cette these l'elaboration de deux systemes complets de generation de la prosodie pour la synthese de la parole. Le premier est base sur une approche probabiliste tandis que le deuxieme s'appuie des representations linguistiques (phonologiques et phonetiques) de l'accentuation, du rythme et de l'intonation. Pour permettre, dans des experimentations futures, l'etude de la complementarite de ces deux methodes, nous nous proposons d'avoir recours a une methode commune de codage de la prosodie, en l'occurrence le systeme intsint. Nous pensons, en effet et bien que cela reste a demontrer, qu'un systeme a base de connaissances linguistiques peut etre applique sur les resultats d'un modele probabiliste (qui necessite pour sa part peu d'informations prosodiques) afin d'ameliorer les performances de la synthese a partir du texte. Nous proposons d'ailleurs en conclusion de ce travail, un prolongement possible qui contribuerait a etendre les possibilites des systemes actuels. Nous presentons egalement un environnement pour le traitement de textes. Il se compose d'un segmenteur (dont le but est de decouper le texte en constituants : mots, phrases, paragraphes), d'un module d'acces lexical (permettant d'acceder aux categories morpho-syntaxique du texte), d'un desambiguisateur morpho-syntaxique (dont le role est de selectionner une categorie parmi le choix possible en fonction du contexte) et d'un module de phonemisation (dont la tache est de transcrire les elements du texte en alphabet phonetique).

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 189 f

Où se trouve cette thèse ?

  • Bibliothèque : Université d'Aix-Marseille (Marseille. St Charles). Service commun de la documentation. Bibliothèque universitaire de sciences lettres et sciences humaines.
  • Disponible pour le PEB
  • Bibliothèque : Université d'Aix-Marseille (Marseille. St Charles). Service commun de la documentation. Bibliothèque universitaire de sciences lettres et sciences humaines.
  • Non disponible pour le PEB
  • Bibliothèque : Université d'Aix-Marseille (Marseille. St Charles). Service commun de la documentation. Bibliothèque universitaire de sciences lettres et sciences humaines.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.