Nouveau modele psychoacoustique pour le codage selon la norme mpeg-1 audio

par JEAN LUC TOBELAIM

Thèse de doctorat en Sciences appliquées

Sous la direction de HAN VU THIEN.

Soutenue en 1997

à CNAM .

    mots clés mots clés


  • Résumé

    Le fonctionnement de l'oreille et les proprietes de l'audition deduites des experiences psychoacoustiques sont maintenant bien connues et fixees. Elles sont appliquees avec une precision plus ou moins grande pour le calcul d'un seuil de masquage ou pour un modele d'oreille. Nous nous interessons au cas des deux modeles, designes n1 et n2, presentes dans la norme mpeg. Leurs interets resident dans le fait qu'ils sont tres differents dans leur conception, le modele n2 est plus complexe et plus precis que le modele n1. Malgre cela, les tests subjectifs n'ont pas montre une difference de qualite significative pour un meme codeur (mpeg couche 2) : les performances du codeur avec l'un ou l'autre des deux modeles sont equivalentes. Nous nous sommes donc demandes si cette precision rajoutee dans le modele n2 est assez bien utilisee pour avoir un effet significatif sur le codage. Nos connaissances psychoacoustiques et nos outils logiciels permettent de verifier le bien-fonde des modelisations utilisees dans chacun des deux modeles. Cette evaluation est effectuee en comparant le comportement et les resultats obtenus par chaque fonction des modeles avec les resultats et interpretations psychoacoustiques connus. Puis, les effets sur le codage et les consequences sur le debit binaire sont observes et interpretes. La comparaison entre les divers elements de deux modeles permet de determiner les parties les plus performantes et celles necessitant une amelioration. Les resultats obtenus ont abouti a la conception d'un modele psychoacoustique. Ce modele est compose de modelisations extraites des deux modeles mpeg et d'ameliorations que nous avons apportees a partir des proprietes de l'audition et des modelisations trouvees dans la litterature. Ce modele est teste et confronte aux deux autres modeles dans les memes conditions. D'une part nous verifions sa conformite avec les differents resultats psychoacoustiques et d'autre part nous evaluons les consequences sur le debit et les effets sur le codage de la precision rajoutee. Les premiers resultats, a l'ecoute, ont montre une amelioration significative de la qualite sonore des sons traites, particulierement au debit monophonique de 96 kbit/s. Mais nous ne pouvons pas conclure de facon precise sur la qualite sonore obtenue avec notre modele puisque les tests subjectifs precis n'ont pu etre effectues. Toutefois, nous montrons que le seuil de masquage, donc le niveau de bruit permis, est mieux calcule car il est plus conforme aux notions psychoacoustiques connues. De plus, nous constatons que cela a un effet significatif sur le bruit de quantification cree par le codage et que cet effet peut avoir des consequences audibles sur les signaux sonores traites principalement dans le cas de codage au debit stereophonique inferieur a 256 kbit/s.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 163 P.
  • Annexes : 53 REF.

Où se trouve cette thèse ?

  • Bibliothèque : Conservatoire national des arts et métiers (Paris). Bibliothèque Centrale.
  • Non disponible pour le PEB
  • Cote : Th A 303
  • Bibliothèque : Conservatoire national des arts et métiers (Paris). Bibliothèque Centrale.
  • Consultable sur place dans l'établissement demandeur
  • Cote : Th A 303 double
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.