Sélection et fusion de signatures visuelles parcimonieuses : application à la classification d'images naturelles

par Grégoire Lefebvre

Thèse de doctorat en Sciences cognitives

Sous la direction de Jean-Marc Salotti et de Christophe Garcia.

Soutenue en 2007

à Bordeaux 2 , en partenariat avec France Télécom R&D (entreprise) .

  • Titre traduit

    Parsimonious visual signature selaction and combination : application to natural image classification


  • Pas de résumé disponible.


  • Résumé

    Les travaux effectués dans le cadre de cette thèse portent sur la classification automatique des images numériques en fonction de leur contenu visuel. L'objectif est d'assigner à une image de test une identité parmi celles d'un ensemble de catégories connues. Pour cela, on cherche à extraire un ensemble de signatures visuelles parcimonieuses, qui lui soit spécifique, puis à sélectionner et structurer l'information discriminante, avant de proposer une classification adaptée à leur nature et à l'application visée. De nombreuses méthodes ont été proposées dans la littérature pour décrire le contenu visuel des images. Parmi les plus efficaces, on compte les techniques d'extraction de points d'intérêt et de descriptions des singularités locales. Ce travail reprend ce principe et propose de nouvelles techniques de sélection et de fusion de signatures locales, basées sur l'analyse de cartes de neurones auto-arganisatrices. Un nouveau support de l'information du contenu visuel est alors proposé comme étant l'activation d'un modèle neuronal multimodal. Les méthodes proposées permettent de se focaliser sur les éléments spécifiques d'une catégorie, vis-à-vis des autres catégories en compétition. Elles permettent ainsi une certaine robustesse aux changements de prises de vue, aux variations d'illumination et aux occultations partielles. Les techniques propsées sont évaluées et comparées aux approches usuelles selon des protocoles expérimentaux rigoureux. Les résultats ainsi obtenus montrent les très bonnes performances des approches introduites dans les domaines de la classification d'images, de la reconnaissance de visages et du filtrage de contenus tendancieux.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (229 p.)
  • Annexes : Bibliogr. p. 219

Où se trouve cette thèse ?

  • Bibliothèque : Université de Bordeaux. Direction de la Documentation. Bibliothèque Sciences de l'homme.
  • Disponible pour le PEB
  • Cote : VTP 2007/3
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.