Modèles pour la découverte, la localisation et l'extraction d'object audio-visuels

par Sanjeel Parekh

Projet de thèse en Informatique

Sous la direction de Slim Essid et de Gaël Richard.

Thèses en préparation à Paris Saclay , dans le cadre de Sciences et Technologies de l'Information et de la Communication , en partenariat avec Laboratoire de Traitement et Communication de l'Information (laboratoire) , S2A - Statistique et Apprentissage (equipe de recherche) et de Télécom ParisTech (établissement de préparation de la thèse) depuis le 20-01-2016 .


  • Résumé

    Les objectifs de cette thèse sont de proposer des modèles d'objets audio-visuels de toute nature qui permettent l'intégration des modalités audio-visuel le plus tôt possible et d'extraire les objets à la fois audio et vidéo indépendamment du fait qu'il existe une corrélation locale entre l'audio et l'objet mouvement.

  • Titre traduit

    Models for Discovering, Locating and Extracting Audio-Visual Objects


  • Résumé

    The goals of this PhD are to propose models of audio-visual objects of any kind that allow integrating audio-visual modalities as early as possible and extracting the objects from both audio and video regardless of whether there exists local correlation between the audio and the object movement.