Thèse soutenue

FR
Auteur / Autrice : Navneet Dalal
Direction : Cordelia SchmidBill Triggs
Type : Thèse de doctorat
Discipline(s) : Imagerie, vision, robotique
Date : Soutenance en 2006
Etablissement(s) : Grenoble INPG

Mots clés

FR

Résumé

FR  |  
EN

La thèse présente méthodes pour description robuste du ccntenu image et "apprentissage machine ala détection de personnes dans les images et les vidéos. Le problème se rèvèle assez difficile en raison de la grande variété de scènes, d'illuminations, de poses et de vêtements des sujets. La résolution demande à la fois une analyse d'image robuste et discriminante et la mise en Jeu des méthodes poussées de la reconnaissance de formes. La contribution principale de la thèse est d'avoir introduit et mis au point un jeu d'indices d'image qui code le contenu local de l'image de façon très résistante aux changements d'illumination et aux petites déformations spatiales, et qui est donc idéal pour les applications de la reconnaissance de formes, L'approche est basée sur les grilles astucieusement normalisées d'histogrammes pondérées des orientations des gradients d'intensité image. En plus, elle mit au point une architecture de détection d'objets avancée et une approche soignée pour apprendre le détecteur en deux phases à partir d'un ensemble d'images types de la classe d'objets. Finalement, sur les mêmes bases on a introduit un deuxième jeu d'indices image qui exploitent les différences locaux du flot optique afin de caractériser le mouvement du sujet a partir de deux clichés d'une séquence vidéo. L'intégration de ces descripteurs dans le détecteur précédant porte un ordre de grandeur de plus de réduction dans le taux de détections erronées, Les résultats ne se bornent pas à la seule détection de personnes, Ils s'étendent directement à la détection d'autres classes comme voitures, vélos, chevaux