Restitution sonore hiérarchique et perceptive d'environnements virtuels multi-modaux

par Emmanuel Gallo

Thèse de doctorat en Informatique

Sous la direction de Georges Drettakis.

  • Titre traduit

    Perceptual sound rendering for multi-modal virtual environments


  • Pas de résumé disponible.


  • Résumé

    Ce travail porte sur la simulation acoustique temps-réel pour des applications de réalité virtuelle ou les jeux vidéo. Ce type d’application nécessite des temps de calculs considérables, augmentant avec la complexité de la scène et impliquant des difficultés pour le rendu interactif. La simulation d’une scène sonore complexe reste encore difficile à réaliser en temps réel à cause du coût de la gestion indépendante des sources sonores. De plus, la description de la scène sonore nécessite de spécifier la nature et la position de chaque source sonore qui la compose, ce qui est une étape longue et fastidieuse. Dans ce cadre, nous avons étudié la possibilité d’effectuer la simulation acoustique en tirant parti de la puissance de calcul des cartes graphiques de dernière génération. Les résultats montrent que l’architecture hautement parallèle de ces cartes est appropriée pour ce type de calcul, augmentant grandement les performances par rapport aux processeurs actuels. Nous nous sommes intéressés par la suite à développer un algorithme exploitant l’audition humaine, permettant d’effectuer un rendu sonore de la scène en respectant un budget d’opérations par ordre de priorité jusqu’à atteindre le budget fixé. Une évaluation subjective a été effectuée pour comparer différentes métriques d’importance pour chaque signal à traiter sur des intervalles de temps très fins. Puis il effectue les opérations par ordre de priorité jusqu’à atteindre le budget fixé. Une évaluation subjective a été effectuée pour comparer différentes métriques d’importance. Enfin, nous avons élaboré une méthode alternative d’acquisition de scène sonore qui évite la modélisation individuelle de chaque source. A partir d’enregistrement monophoniques simultanés d’une scène réelle, cette méthode en détache les sources qui la composent. En étudiant les différences de temps d’arrivée des enregistrements sur plusieurs bandes de fréquence, une position est extraite pour la source sonore émettrice la plus présente dans chaque bande. Les composantes de chaque source peuvent ensuite être spatialisées aux positions trouvées. En utilisant ce principe, nous pouvons également rééditer la scène acquise ; Par exemple, nous pouvons déplacer ou supprimer une source, ou changer la position de l’auditeur en temps réel. Nous pouvons aussi combiner plusieurs éléments provenant de différents enregistrements tout en assurant une cohérence spatiale globale.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (xx-138 p.)
  • Annexes : Bibliogr. p. 123-138. Résumés en français et en anglais

Où se trouve cette thèse ?

  • Bibliothèque : Université Nice Sophia Antipolis. Service commun de la documentation. Section Sciences.
  • Non disponible pour le PEB
  • Cote : 07NICE4013
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.