Fusion de données audio-visuelles pour l'interaction homme-robot

Brice Burger

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

FR |

EN

Auteur / Autrice :	Brice Burger
Direction :	Frédéric Lerasle, Isabelle Ferrané
Type :	Thèse de doctorat
Discipline(s) :	Systèmes embarqués
Date :	Soutenance en 2010
Etablissement(s) :	Toulouse 3

Mots clés

FR

Mots clés contrôlés

Reconnaissance automatique de la parole

Homme -- Attitude et mouvement

Systèmes adaptatifs (technologie)

Systèmes homme-machine

Mots clés libres

Interaction multimodale

Fusion multimodale

Robotique d'assistance

Suivi d'objets multiples

Filtrage particulaire

Reconnaissance et interprétation de la parole

Résumé

FR |

EN

Dans le cadre de la robotique d'assistance, cette thèse a pour but de fusionner deux canaux d'informations (visuelles et auditives) dont peut disposer un robot afin de compléter et/ou confirmer les données qu'un seul canal aurait pu fournir, et ce, en vue d'une interaction avancée entre homme et robot. Pour ce faire, nos travaux proposent une interface perceptuelle pour l'interaction multimodale ayant vocation à interpréter conjointement parole et geste, notamment pour le traitement des références spatiales. Nous décrivons dans un premier temps la composante parole de nos travaux qui consiste en un système embarqué de reconnaissance et d'interprétation de la parole continue. Nous détaillons ensuite la partie vision composée d'un traqueur visuel multi-cibles chargé du suivi en 3D de la tête et des deux mains, ainsi que d'un second traqueur chargé du suivi de l'orientation du visage. Ces derniers alimentent un système de reconnaissance de gestes par DBNs décrit par la suite. Nous poursuivons par la description d'un module chargé de la fusion des données issues de ces sources d'informations dans un cadre probabiliste. Enfin, nous démontrons l'intérêt et la faisabilité d'une telle interface multimodale à travers un certains nombre de démonstrations sur les robots du LAAS-CNRS. L'ensemble de ces travaux est fonctionnel en quasitemps réel sur ces plateformes robotiques réelles.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Fusion de données audio-visuelles pour l'interaction homme-robot

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Fusion de données audio-visuelles pour l'interaction homme-robot

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses