Sélection et fusion de signatures visuelles parcimonieuses : application à la classification d'images naturelles

par Grégoire Lefebvre

Thèse de doctorat en Sciences cognitives

Sous la direction de Jean-Marc Salotti et de Christophe Garcia.

Soutenue en 2007

à Bordeaux 2 , en partenariat avec France Télécom R&D (entreprise) .


  • Résumé

    Les travaux effectués dans le cadre de cette thèse portent sur la classification automatique des images numériques en fonction de leur contenu visuel. L'objectif est d'assigner à une image de test une identité parmi celles d'un ensemble de catégories connues. Pour cela, on cherche à extraire un ensemble de signatures visuelles parcimonieuses, qui lui soit spécifique, puis à sélectionner et structurer l'information discriminante, avant de proposer une classification adaptée à leur nature et à l'application visée. De nombreuses méthodes ont été proposées dans la littérature pour décrire le contenu visuel des images. Parmi les plus efficaces, on compte les techniques d'extraction de points d'intérêt et de descriptions des singularités locales. Ce travail reprend ce principe et propose de nouvelles techniques de sélection et de fusion de signatures locales, basées sur l'analyse de cartes de neurones auto-arganisatrices. Un nouveau support de l'information du contenu visuel est alors proposé comme étant l'activation d'un modèle neuronal multimodal. Les méthodes proposées permettent de se focaliser sur les éléments spécifiques d'une catégorie, vis-à-vis des autres catégories en compétition. Elles permettent ainsi une certaine robustesse aux changements de prises de vue, aux variations d'illumination et aux occultations partielles. Les techniques propsées sont évaluées et comparées aux approches usuelles selon des protocoles expérimentaux rigoureux. Les résultats ainsi obtenus montrent les très bonnes performances des approches introduites dans les domaines de la classification d'images, de la reconnaissance de visages et du filtrage de contenus tendancieux.

  • Titre traduit

    Parsimonious visual signature selaction and combination : application to natural image classification


  • Résumé

    This thesis is concerned with automatic classification. The objective is to assign an identity to a test image among a set of known category. The underlying approach aim at extracting a specific set of parsimonious visual signatures, then selecting and melting discriminative information, before designing a classification scheme adapted to the context. Many methods have been proposed in order to describe visual content. One of the most effective is based on points of interest extraction and local singularity description. In the thesis, this principle is used to define nex local signature and combination, based on self prganizing neural maps. A novel image information support s then proposed, being the activation of a multimodal neural model. The proposed methods focus on a specific elements of one image class versus the other categories. It permits robustness to viewpoint changes, illumination variations and partial occlusions. The proposed techniques are evaluated and compared to usual methods using various international databases. These experimants show the effectiveness of the proposed approaches, in particular, in the domains of image classification, face recognition and objectionable content exclusion.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (229 p.)
  • Annexes : Bibliogr. p. 219

Où se trouve cette thèse ?

  • Bibliothèque : Université de Bordeaux. Direction de la Documentation. Bibliothèque Sciences de l'homme.
  • Disponible pour le PEB
  • Cote : VTP 2007/3
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.