Interaction multimodale oro-gestuelle personne libre : application à l'interaction multi-utilisateur avec de grands écrans
Auteur / Autrice : | Sébastien Carbini |
Direction : | Pierre-Yves Coulon |
Type : | Thèse de doctorat |
Discipline(s) : | Signal, image, parole, télécoms |
Date : | Soutenance en 2006 |
Etablissement(s) : | Grenoble INPG |
Ecole(s) doctorale(s) : | École doctorale électronique, électrotechnique, automatique, traitement du signal (Grenoble199.-....) |
Partenaire(s) de recherche : | Entreprise : France Télécom R&D (2001-2007) |
Jury : | Président / Présidente : Jean Caelen |
Examinateurs / Examinatrices : Pierre-Yves Coulon, Jean Emmanuel Viallet | |
Rapporteurs / Rapporteuses : Noëlle Carbonell, Patrice Dalle |
Mots clés
Mots clés contrôlés
Résumé
Cette thèse propose de concevoir et d'étudier une interface multimodale permettant d'interagir à la voix et au geste avec un grand écran. Pour la reconnaissance de geste, la tête et les mains d'un utilisateur sont détectées et suivies en temps réel à partir d'une caméra stéréo. Chaque partie du corps a un modèle statistique dont les paramètres sont estimés à chaque nouvelle image par l'algorithme Expectation Maximisation. Le suivi permet de reconnaître des gestes de pointage, de sélection et des gestes bi-manuels simples (rotation, redimensionnement). Pour la parole, une brique de reconnaissance multi-locuteur déjà disponible a été utilisée. Dans un premier temps, la fusion du geste et de la parole permet d'obtenir une souris "oro-gestuelle" sans contact permettant d'interfacer la plupart des applications. Dans une version plus avancée, la prise en compte du contexte de l'application lors de la fusion permet des commandes multimodales plus intuitives.