Modelisation de la composante stochastique de la parole

par Gaël Richard

Thèse de doctorat en Sciences appliquées

Sous la direction de JEAN SYLVAIN LIENAR.

Soutenue en 1994

à Paris 11 .

    mots clés mots clés


  • Résumé

    Le cadre general de ce travail est celui de la synthese de la parole par ordinateur. Le signal de parole est souvent scinde en deux composantes principales: 1) une composante deterministe (constituee des elements quasi-periodiques ou voises qui sont produits par une vibration quasi reguliere des cordes vocales); 2) une composante stochastique ou de bruit (constituee des elements de nature aleatoire pouvant survenir durant un son voise (bruit fricatif dans le phenomene/v/) ou en l'absence de vibration des cordes vocales (bruit fricatif dans /s/, /t/. . . ). Le but de ce travail est d'apporter une contribution a une modelisation precise de cette seconde composante et notamment des signaux de bruits modules (bruits des fricatives voisees). Apres une etude des proprietes statistiques des deux premiers ordres des bruits de la parole, nous introduisons une methode de synthese s'inspirant du bruit de grenaille. Cette technique consiste a introduire des processus ponctuels (points de poisson) qui definiront des instants d'occurrence d'evenements spectraux (representes par des formes d'ondes formantiques ou fof). Puis, en nous appuyant sur un support theorique qui utilise la notion de representation de rice, nous presentons plusieurs algorithmes d'analyse/synthese de ces bruits. Un premier groupe de methodes estime les parametres des fof (frequence centrale, amplitude, largeur de bande) a partir d'une analyse par prediction lineaire (lpc), et les processus ponctuels sont deduits des maxima de l'enveloppe temporelle des signaux dans chaque sous bande frequentielle (environ six). Un second groupe de methodes opere uniquement dans le domaine temporel, ainsi les caracteristiques frequentielles des fof sont estimees directement sur le signal dans une bande formantique (ou sous bande frequentielle). Des tests de perception ont montres que ces methodes produisent des signaux juges naturels et que notamment ils s'integrent mieux au reste du signal (composante deterministe) que ceux produits par des methodes classiques (ex methode lpc). Finalement, quelques exemples d'application sont donnes (introduction dans un systeme de synthese a partir du texte, bruits des instruments de musique, applaudissements. . . )


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 210 P.
  • Annexes : 193 REF.

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Accessible pour le PEB
  • Bibliothèque : Centre Technique du Livre de l'Enseignement supérieur (Marne-la-Vallée, Seine-et-Marne).
  • Disponible pour le PEB
  • Cote : TH2014-011706
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.