Restitution temps reel a debit variable d'un signal de parole. De l'algorithme a l'architecture materielle

par BORIS SIEPERT

Thèse de doctorat en Sciences et techniques

Sous la direction de Didier Demigny.

Soutenue en 1998

à Paris 6 .

    mots clés mots clés


  • Résumé

    Nous proposons dans cette these une famille d'algorithmes destines a la modification du debit de la parole numerisee. Une realisation pratique sous forme d'une carte hybride, constituee d'un circuit dedie (fpga) et d'un microcontroleur, est presentee. Elle permet d'enregistrer la parole provenant de n'importe quel support audio (cd, k7, microphone) et de la restituer ensuite a duree et vitesse variable, avec une tres bonne qualite auditive (qualite radio am). Dans le premier chapitre nous presentons un modele de production de la parole et definissons quelques termes associes au traitement de la parole. Ensuite nous faisons un tour d'horizon des algorithmes existants de modification de l'echelle temporelle de la parole, et nous discutons de leur application a notre probleme. A partir de la, nous proposons dans le deuxieme chapitre une famille d'algorithmes originaux pour le ralentissement et l'acceleration de la parole, en decrivant les relations avec les algorithmes existants ainsi que les nouveautes des algorithmes proposes. Nous decrivons leur validation logicielle par simulation et des tests auditifs. L'etude architecturale est presentee dans le troisieme chapitre. Elle est basee en bonne partie sur les experiences acquises par la conception d'un premier asic gerant tout un systeme pour l'enregistrement et la restitution de la parole, qui est brievement decrit. Par l'intermediaire de ce premier asic, nous arrivons a la conclusion qu'un systeme hybride, un circuit dedie avec un composant a usage general, est plus adapte a cette application. Nous montrons de quelle facon cela change le cahier des charges pour un deuxieme asic et decrivons sa conception en vhdl. La realisation physique d'un tel systeme pour la modification de l'echelle temporelle de la parole est finalement exposee dans le quatrieme chapitre. Le circuit dedie etant realise sous forme d'un circuit programmable, nous expliquons les avantages de ce choix pour une conception en langage de haut niveau.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 169 p.
  • Annexes : 124 ref.

Où se trouve cette thèse ?

  • Bibliothèque : Ecole nationale supérieure de l'électronique et de ses applications. Centre de documentation.
  • Disponible pour le PEB
  • Cote : ARCH-3700
  • Bibliothèque : Université Pierre et Marie Curie. Bibliothèque Universitaire Pierre et Marie Curie. Section Biologie-Chimie-Physique Recherche.
  • Disponible pour le PEB
  • Bibliothèque : Centre Technique du Livre de l'Enseignement supérieur (Marne-la-Vallée, Seine-et-Marne).
  • Disponible pour le PEB
  • Cote : PMC RT P6 1998
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.