Machine observation of the direction of human visual focus of attention

par Nicolas Gourier

Thèse de doctorat en Imagerie, vision et robotique

Sous la direction de James L Crowley et de Daniela Hall.

Soutenue en 2006

à Grenoble, INPG .


  • Résumé

    Cette thèse présente une approche à 2 niveaux pour estimer la pose d'un visage. Les images de visage sont normalisées en taille à l'aide d'un algorithme de suivi de visage, projetées dans des mémoires autoassociatives et entraînées par la règle de Widrow-Hoff, ce qui permet la sauvegarde de prototypes de poses du visage humain. Les traits saillants du visage sont détectés par les champs réceptifs gaussiens et motivent la construction d'un modèle de graphe pour chaque pose. Chaque nœud du graphe peut être déplacé localement en fonction de la saillance du point facial qu'il représente. Nous recherchons parmi les poses voisines de celle trouvée par les mémoires autoassociatives le graphe qui correspond le mieux à l'image de test. La pose correspondante est sélectionnée comme la pose du visage. Cette méthode n'utilise pas d'heuristique, d'annotation manuelle ou de connaissances préalables sur le visage, délivre des résultats comparables à la performance humaine et peut être adaptée pour estimer la pose d'autres objets.


  • Pas de résumé disponible.

  • Titre traduit

    Observation de la direction du focus visuel d'attention par ordinateur


  • Résumé

    This thesis proposes a two-stage approach to estimate human head pose. Face images are normalized in size using a robust face tracker, projected into linear auto-associative memories and trained using the Widrow-Hoff correction rule, which allows the storage of head pose prototypes. Salient facial features are detected using normalized Gaussian receptive fjelds and motivates the construction of a model graph for each pose. Each node of the graph can be locally displaced in respect to its saliency in the face image. We seek among the neighbouring poses of the one found by linear auto-associative memories the graph which provides the best match. The corresponding pose is selected as the head pose. This method do not use any heuristics, manual annotation or prior knowledge on the face, provides results similar to those obtained by humans and can be adapted to estimate the orientation of other objects.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. ( 191 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 179-191

Où se trouve cette thèse ?

  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Non disponible pour le PEB
  • Cote : TS06/INPG/0111
  • Bibliothèque : Service interétablissements de Documentation (Saint-Martin d'Hères, Isère). Bibliothèque universitaire de Sciences.
  • Disponible pour le PEB
  • Cote : TS06/INPG/0111/D
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.