Definition d'un modele psychoacoustique dans le contexte du codage audionumerique a reduction de debit

par XAVIER DUROT

Thèse de doctorat en Traitement du signal

Sous la direction de Stephen McAdams.

Soutenue en 1998

à Rennes 1 .

    mots clés mots clés


  • Résumé

    Probleme a resoudre : le codage audionumerique a reduction de debit consiste a effectuer une compression des donnees numeriques sonores afin de reduire la quantite d'informations a graver sur un disque ou a transmettre sur les ondes. L'utilisation de la psycho-acoustique dans le procede de compression ameliore considerablement la reduction, car elle permet d'exploiter les imperfections de l'oreille humaine (masquage, seuil absolu d'audition) pour camoufler les degradations dues a la compression. Le probleme a resoudre peut en fait simplement s'exprimer en ces termes : pour un son numerique donne, calculer a tout instant les caracteristiques temporelles et frequentielles des degradations que l'on peut lui apporter sans que cela soit audible. La norme iso-mpeg-audio propose deux modeles psychoacoustiques qui dans le schema de codage en sous-bandes propose permettent un rapport de compression de l'ordre de 6. Nouveau modele : le modele commence par simuler les filtres auditifs avec des filtres numeriques. Les phenomenes de masquage temporel et frequentiel sont simules en ajoutant a chaque filtre une combinaison lineaire des filtres voisins, ce qui permet de faconner plus precisement leurs fenetres frequentielles et temporelles. Pour en deduire le bruit maximal autorise en tout point de la membrane basilaire, on a besoin de tester si chaque composante de son est plutot sinusoidale ou plutot proche d'un bruit. La grande difficulte dans l'elaboration d'un modele vient des inconnues dans le domaine psychoacoustique. En particulier, nous raisonnons comme si la musique etait une somme de sinus et de bruits, ce qui est faux, surtout dans les transitoires. Nous avons mene au sein de notre laboratoire quelques experiences psychoacoustiques complementaires qui faisaient defaut dans la litterature. Resultats : nous avons construit un nouveau modele sur des bases totalement nouvelles. Selon les applications, sa qualite est equivalente ou meilleure que les modeles de mpeg.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 216 P.
  • Annexes : 72 REF.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Rennes I. Service commun de la documentation. Section sciences et philosophie.
  • Disponible pour le PEB
  • Cote : TA RENNES 1998/4
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.