Application de la transformée en nombres entiers à l'étude et au développement d'un codeur de parole pour transmission sur réseaux IP

par Guillaume Madre

Thèse de doctorat en Électronique

Sous la direction de Gilles Burel.

Soutenue en 2004

à Brest .


  • Résumé

    Notre étude s'inscrit dans le domaine de la compression des signaux vocaux pour la transmission de voix par réseau Internet (VoIP : Voice over Internet Protocol). Les perspectives à moyen terme étant la mise en place d'une application de téléphonie IP, nos travaux fournissent les premiers éléments pour le fonctionnement en réel d'un système de codage de parole et son intégration à un processeur DSP. Ils se sont concentrés sur le codeur de parole G. 729 de type CS-ACELP (Conjugate Structure –Algebraic Code-Excited Linear Prediction), retenu parmi les recommandations de l'Union Internationale des Télécommunications (UIT) et déjà reconnu pour sa faible complexité d'implantation. L'étude principale a été d'améliorer ses performances et diminuer sa charge de calcul tout en maintenant un équilibre entre la qualité de codage et la complexité de calcul engendrée. Pour réduire le coût de calcul de ce codeur, nous avons approfondi les bases mathématiques de la Transformée en Nombres Entiers (NTT : Number Theoretic Transform) qui est amenée à trouver des applications de plus en plus diverses en traitement du signal. Nous avons introduit plus particulièrement la Transformée en Nombres de Fermat (FNT : Fermat Number Transform) qui est la plus adaptée aux opérations de traitement numérique. Nous avons constaté que son application à certains algorithmes de codage permet une réduction importante de la complexité de calcul. Ainsi, le développement de nouveaux algorithmes performants, pour la Prédiction Linéaire (LP : Linear Prediction) du signal et la modélisation de l'excitation, a permis une modification du codeur G. 729 en vue de son implantation sur un processeur à virgule fixe. De plus, une nouvelle fonction de détection d'activité de parole (VAD : Voice Activity Detection) a permis la mise en place d'une procédure de compression des silences plus efficace et la réduction du débit de transmission

  • Titre traduit

    Application of the Number Theoretic Transform to a speech coder study and development for transmission on IP network


  • Résumé

    Our study considers the vocal signals compression for the transmission of Voice over Internet Protocol (VoIP). The prospects being the implementation of a telephony IP application, the work provides the first elements for a real-time speech coding system and its integration to a DSP. They are concentrated on the speech CS-ACELP (Conjugate Structure- Algebraic Code-Excited Linear Prediction) G. 729 coder, retained among the International Telecommunications Union (ITU) recommendations and already recognized for its low implementation complexity. The main aspect was to improve its performances and to decrease its computational cost, while maintaining the compromise between the coding quality and the required complexity. To reduce the computational cost of this coder, we looked further into the mathematical bases of the Number Theoretic Transform (NTT) which is brought to find more and more various applications in signal processing. We introduced more particularly the Fermat Number Transform (FNT) which is well suited for digital processing operations. Its application to different coding algorithms allows an important reduction of the computational complexity. Thus, the development of new efficient algorithms, for the Linear Prediction (LP) of the speech signal and the excitation modeling, has allowed a modification of the G. 729 coder and his implementation on a fixed-point processor. Moreover, a new function of Voice Activity Detection (VAD) has carried out the implementation of one more efficient procedure for silences compression and the reduction of the transmission rate.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (183 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 175-182

Où se trouve cette thèse ?

  • Bibliothèque : Université de Bretagne Occidentale. Service commun de la documentation Section Droit-Sciences-STAPS.
  • Disponible pour le PEB
  • Cote : TBRC2004/41
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.