Élaboration d'un module de règles phonético-acoustiques pour un système de synthèse à partir du texte pour le français

par Martine Garnier-Rizet

Thèse de doctorat en Sciences du langage

Sous la direction de Jean-Sylvain Liénard.

Soutenue en 1994

à Paris 3 .


  • Résumé

    The purpose of this work is the elaboration of a rule-based module for a text-to-speech synthesizer for french. Speech synthesis has to deal with one of the main aspects of speech : speech is a continuum that is usually divided into units. The nature and complexity of these units are different depending on the level of description we work at. The input of the segmental module is a stream of phonetic units. When in isolation, the phonetic unit is instanciated in the vocal tract by a phonetic gesture, that is the canonical form. The acoustical result is a "target" with specific spectral values. In continuous speech, there is a temporal overlap in the succession of gestures which instanciate the segments. At the acoustic level, the gesturalinteraction inducts spectral modifications which operate on the target values. The elaboration of the module starts with the analysis of a large natural speech data base from a single speaker. First, the target values are extracted from the data base, for all the phonemes. They characterize the speaker. The coarticulation phenomena are then modeled by bontext-sensitive rules, at the acoustic level. This study is concerned by some major aspects of speech synthesis by rules. For example : the validity of a corpus with constraints ; the search for an interface between different levels of description ; the use of acoustic features for writing rules ; the intelligibility and quality of the synthesis obtained. This study has been carried out within the polyglot, esprit project 1024 "a multilingual text-tospeech and speech-to-text system. The aim of polyglot was to build up a multilingual text-to-speech system for six european languages.


  • Résumé

    Ce document presente les travaux qui ont conduit a l'elaboration d'un module de regles phoneticoacoustiques pour un systeme de synthese a partir du texte. La demarche sous-jacente a toutes les methodes de synthese repose sur un aspect fondamental de la parole : celle-ci constitue un continuum sonore qu'on decompose en unites de complexite et de nature differentes selon le niveau de description choisi. L'entree du module segmental est une chaine d'unites linguistiques. Isolement, chaque unite est instanciee dans le conduit vocal par un geste articulatoire qui constitue sa forme canonique et dont le resultat acoustique est une "cible acoustique" de reference. Dans la parole continue, on observe un chevauchement temporel dans la succession des gestes articulatoires qui actualisent les segments. Cette interaction des gestes au plan articulatoire se manifeste au plan acoustique par des modifications spectrales des segments par rapport a leur valeur cible. L'elaboration du module debute par l'analyse d'un large curpus de parole naturelle issu d'un locuteur donne. Cette analyse permet tout d'abord d'extraire les cibles acoustiques propres a ce locuteur puis de modeliser l'incidence des phenomenes de coarticulation au niveau acoustique. Cette etude souligne plusieurs aspects majeurs dudeveloppement d'un systeme de synthese par regles : la validite d'un corpus d'etude avec contraintes ; la recherche d'une interface entre differents niveaux de description ; la validite des traits phonetiques pour l'ecriture des regles ; l'intelligibilite et la qualite de la synthese obtenue. Ce travail a ete effectu dans le cadre du projet esprit 1024 polyglot "a multilingual text-tospeech and speech-to-text system" dont l'objet est la realisation d'un synthetiseur a partir du texte multilingue pour six langues europeennes.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (323 f.)
  • Notes : Publication autorisée par le jury

Où se trouve cette thèse ?

  • Bibliothèque : Université Sorbonne Nouvelle. Direction des Bibliothèques Universitaires. Section Censier.
  • Disponible pour le PEB
  • Bibliothèque : Université Sorbonne Nouvelle. Direction des Bibliothèques Universitaires. Section Censier.
  • Accessible pour le PEB
  • Bibliothèque : Centre Technique du Livre de l'Enseignement supérieur (Marne-la-Vallée, Seine-et-Marne).
  • Disponible pour le PEB
  • Cote : I 4= 17556

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Bibliothèque interuniversitaire de la Sorbonne (Paris).
  • Non disponible pour le PEB
  • Cote : TMC 2148
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.