Identification de personnes dans un flux vidéo par l’apparence et la démarche

par Ahmed Derbel

Thèse de doctorat en Sciences et technologies industrielles

Sous la direction de Sylvie Treuillet et de Abdelmajid Ben Hamadou.

Soutenue le 08-09-2014

à Orléans en cotutelle avec l'Université de Sfax (Tunisie) , dans le cadre de École doctorale Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes (Centre-Val de Loire) , en partenariat avec Institut Pluridisciplinaire de recherche en ingénierie des systèmes, mécanique et énergétique (Orléans ; 2008-) (équipe de recherche) et de Institut Pluridisciplinaire de Recherche en Ingénierie des Systèmes- Mécanique et Energétique (laboratoire) .

Le président du jury était Karim Abed-Meraim.

Le jury était composé de Sylvie Treuillet, Abdelmajid Ben Hamadou, Karim Abed-Meraim, Patrick Gros, Frédéric Lerasle, Mohamed Hammami, Yousra Ben Jemaa, Bruno Emile.

Les rapporteurs étaient Patrick Gros, Frédéric Lerasle.


  • Résumé

    Avec l’installation généralisée de caméras de surveillance dans les zones urbaines, l’enjeu de cette thèse est la reconnaissance automatique de piétons par l’apparence et la démarche. Cette reconnaissance nécessite des descripteurs robustes pour caractériser et identifier une personne au-delà des modifications d’apparence induites par un changement de point de vue, d’éclairage ou des variations de déplacement. La première partie propose une nouvelle mesure de similarité exploitant l’information intra et inter-personnes dans les histogrammes régionaux couleur. Une étude comparative montre l’intérêt de cette modélisation pour s’affranchir des variations de luminosité et de pose. Une fusion pondérée des descripteurs d’apparence les plus performants permet ensuite d’améliorer le taux d’identification. La seconde partie étudie la reconnaissance par la démarche selon un point de vue latéral puis frontal. Pour une observation latérale du piéton, la dynamique de la marche est modélisée par les variations spatiotemporelles des points d’articulation des deux jambes. Tandis qu’en vue frontale, on analyse la distribution des mouvements dans les silhouettes soit par une carte binaire de l’enveloppe (RED), soit par une carte en niveaux de gris des fréquences (RFD). L’étude expérimentale démontre que les descripteurs proposés font preuve de bonnes performances face à l’état de l’art, et qu’une fusion de plusieurs descripteurs permet toujours d’améliorer notablement les taux de reconnaissance. Enfin, la dernière partie de la thèse introduit un système d’identification complet associant l’apparence et la démarche. Cette approche mixte est évaluée sur une base de séquences vidéo intégrant de fortes variations de point de vue et d’éclairage. Elle offre un bon compromis entre efficacité et temps de calcul pour une application en vidéo surveillance.

  • Titre traduit

    People identification in video sequences by appearance and gait


  • Résumé

    With the wide-spread installation of cameras in urban areas, this thesis deals with an automatic people identification by appearance and gait. This recognition requires robust descriptors to represent and discriminate each person despite the appearance variations caused by changing view point, lighting or way of moving (speed, carrying a bag…). The first part, dedicated to appearance identification, proposes a new similarity measure using intra and inter-person information with regional color histograms. A comparative study shows the efficiency of this representation to overcome the lighting and pose variations. The recognition rate is then improved by merging the most robust appearance descriptors. The second part is focused on gait recognition by distinguishing lateral and frontal points of view. For lateral observation, a pedestrian is characterized by several spatio-temporal variations of some articulated points of the legs. While, the motion of global silhouette is analyzed using a binary envelope map (RED) and a gray levels frequency map (RFD) in frontal point of view. Experimental test prove that those descriptors provide good performances compared to other state-of-art approaches, and that merging descriptors always improves the recognition rate. The last part introduces an identification system coupling appearance and gait. This merging approach is evaluated on a video sequences database including large points of view and lighting variations. It provides a good compromise between efficiency and processing time for application in video surveillance.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse ?

  • Bibliothèque : Université d'Orléans (Bibliothèque électronique). Service commun de la documentation.Division des affaires générales.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.