Vers une reconnaissance des activités humaines non supervisées et des gestes dans les vidéos

Farhood Negin

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

FR |

EN

Auteur / Autrice :	Farhood Negin
Direction :	François Brémond
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 15/10/2018
Etablissement(s) :	Université Côte d'Azur (ComUE)
Ecole(s) doctorale(s) :	École doctorale Sciences et technologies de l'information et de la communication (Sophia Antipolis, Alpes-Maritimes)
Partenaire(s) de recherche :	établissement de préparation : Université de Nice (1965-2019)
	Laboratoire : Institut national de recherche en informatique et en automatique (France). Unité de recherche (Sophia Antipolis, Alpes-Maritimes) - Spatio-Temporal Activity Recognition Systems
Jury :	Président / Présidente : Frédéric Precioso
	Examinateurs / Examinatrices : Frédéric Precioso, François Charpillet, Christian Wolf, Matthieu Cord
	Rapporteurs / Rapporteuses : François Charpillet, Christian Wolf

Mots clés

FR |

EN

Mots clés contrôlés

Apprentissage automatique

Reconnaissance gestuelle

Reconnaissance de l'activité humaine (informatique)

Vision par ordinateur

Mots clés libres

Vision par ordinateur

Reconnaissance de l'activité humaine

Reconnaissance gestuelle

Apprentissage automatique

Résumé

FR |

EN

L’objectif principal de cette thèse est de proposer un framework complet pour une découverte, modélisation et reconnaissance automatiques des activités humaines dans les vidéos. Afin de modéliser et de reconnaître des activités dans des vidéos à long terme, nous proposons aussi un framework qui combine des informations perceptuelles globales et locales issues de la scène, et qui construit, en conséquence, des modèles d’activités hiérarchiques. Dans la première catégorie du framework, un classificateur supervisé basé sur le vecteur de Fisher est formé et les étiquettes sémantiques prédites sont intégrées dans les modèles hiérarchiques construits. Dans la seconde catégorie, pour avoir un framework complètement non supervisé, plutôt que d’incorporer les étiquettes sémantiques, les codes visuels formés sont stockés dans les modèles. Nous évaluons les frameworks sur deux ensembles de données réalistes sur les activités de la vie quotidienne enregistrées auprés des patients dans un environnement hospitalier. Pour modéliser des mouvements fins du corps humain, nous proposons quatre différents frameworks de reconnaissance de gestes où chaque framework accepte une ou une combinaison de différentes modalités de données en entrée. Nous évaluons les frameworks développés dans le contexte du test de diagnostic médical, appelé Praxis. Nous proposons un nouveau défi dans la reconnaissance gestuelle qui consiste à obtenir une opinion objective sur les performances correctes et incorrectes de gestes très similaires. Les expériences montrent l’efficacité de notre approche basée sur l’apprentissage en profondeur dans la reconnaissance des gestes et les tâches d’évaluation de la performance.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Vers une reconnaissance des activités humaines non supervisées et des gestes dans les vidéos

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Vers une reconnaissance des activités humaines non supervisées et des gestes dans les vidéos

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses