Détection d'objets basée sur une cascade de classifieurs de type boosting : de la description haut niveau à l'implantation matérielle

par Khalil Khattab

Thèse de doctorat en Informatique et instrumentation de l'image

Sous la direction de Johel Miteran.

Soutenue en 2009

à Dijon .


  • Résumé

    La détection de visages est considérée comme un prérequis pour des nombreuses applications dans le domaine de la vision assistée par ordinateur. Ce manuscrit présente les travaux effectués pour définir et valider une architecture innovante capable d’implanter un système de détection de visage temps réel tout en s'appuyant sur un langage de description de haut niveau tel que SystemC. Les algorithmes de détection de visages basée sur une cascade de classifieur de type Boosting sont considérés aujourd'hui comme ces algorithmes de détection sont les plus performants en termes de temps de traitement et taux de détection. Toutefois, la mise en œuvre matérielle d'une solution temps réel pour tels algorithmes présente toujours un défi. Un nouveau modèle de traitement en pipeline est proposé. Ce modèle est capable d'exploiter le parallélisme de ces algorithmes, et de fournir une régularité dans le temps de traitement. Ce modèle peut également être paramétré en fonction de la cascade utilisée. Les blocs de traitement sont modélisés en SystemC. Nous montrons qu’en utilisant un modèle de description SystemC couplé avec un outil de synthèse haut niveau, peut aboutir à des implantations embarquées. Nous montrons ainsi certains compromis et considérations nécessaires afin que ces implantations soient efficaces. À partir des résultats des implantations initiales des blocs de traitements, la mise en place des communications du système est réalisée. Cette mise en œuvre du système complet se révèle capable d'atteindre une vitesse de détection 44 images par seconde pour des images de 320x240, ainsi que de garder les mêmes performances en taux de détection que la méthode d’origine.

  • Titre traduit

    Cascade Boosting Based Object Detection from High Level Description to Hardware Implementation


  • Résumé

    Object detection forms the first step of a larger setup for a wide variety of computer vision applications. The focus of this manuscript is the implementation of a real time embedded face detection system, while relying on high level description language such as SystemC. Boosting based object detection algorithms are considered as the fastest accurate object detection algorithms today. However, the implementation of a real time solution for such algorithms is still a challenge. A new parallel implementation, which exploits the parallelism and the pipelining in these algorithms, is proposed. The processing blocs are modeled using SystemC. We show that, using a SystemC description model paired with a mainstream automatic synthesis tool, can lead to an efficient embedded implementation. We also display some of the tradeoffs and considerations, for this implementation to be effective. Using the results of the processing blocs’ implantations, full system architecture is defined. This system proves capable of achieving 44 frames per second for 320x240 images as well as keeping the same detection accuracy as the original method.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol.(176 p.)
  • Annexes : Bibliogr. p. 171-176, [115] réf.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Bourgogne. Service commun de la documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : TDDIJON/2009/64
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.