Représentations d'images pour la recherche et la classification d'images

par Josip Krapac

Thèse de doctorat en Informatique et applications

Sous la direction de Frédéric Jurie.

Soutenue en 2011

à Caen .


  • Résumé

    La représentation des images en vue de leur traitement est une question fondamentale de la vision par ordinateur. Les contributions proposées dans cette thèse étendent le modèle de représentation par sac-de-mots pour les tâches de recherche et de classification d’images. La première des tâches abordées est celle de la recherche d’images. L’idée est de reclasser les images fournies par un moteur de recherche utilisant des requêtes textuelles. La représentation de l'image développée ici utilise non seulement le contenu visuel de l'image, mais aussi la requête de texte utilisée pour le récupérer. Cela permet l'apprentissage d'un modèle de pertinence unique qui peut être utilisé ultérieurement pour réordonner les images de nouvelles requêtes. Ce modèle donne de meilleurs résultats que les modèles appris spécifiquement pour chaque requête [Schroff et al. , 2007], qui nécessitent pourtant des calculs plus complexes. Ensuite, nous proposons une représentation d'image spécifique aux classes, basée sur un quantifieur en arbre, spécialisée pour la tâche de classification d'image. Par opposition à [Moosmann et al. , 2008] qui construisent une forêt aléatoire avec l’objectif d’optimiser la classification de régions de l'image, notre construction est guidée par l’optimisation directe de la performance de classification des images elles-mêmes. Il en résulte une représentation des images très compacte, rapide à créer et qui donnant d'excellents résultats même en utilisant de simples classifieurs linéaires. Notre dernière contribution est une nouvelle représentation permettant le codage spatial des images. Nous utilisons des Fisher Kernels pour représenter la répartition des zones d'image attribuées à un mot visuel. Cette représentation est beaucoup plus compacte que les pyramides spatiales de [Lazebnik et al. , 2007], tout en obtenant le même niveau de performance, voir même en le dépassant.

  • Titre traduit

    Image Representations for Ranking and Classification


  • Résumé

    Image representation is a fundamental question for several computer vision tasks. The contributions discussed in this thesis extend state-of-the-art bag-of-words representations for the tasks of image re-ranking and classification. The goal of image re-ranking is to sort by relevance the images retrieved by a text query, taking into account their visual content. The developed image representation depends not only on visual content of the image, but also on the text query used to retrieve it. This allows learning of a single relevance model that can be used to re-order the images for new, never seen queries. This model gives better results than models learned specifically for each query [Schroff et al. , 2007], which are computationally more complex. Next, we propose a class-specific image representation that uses tree-structured quantizers, targeted for image classification task. As opposed to [Moosmann et al. , 2008] who construct random forest with a goal of minimizing classification loss of image regions, our construction is guided by minimizing image classification loss. This results in very compact image representation, which is fast to create and which gives excellent results using linear classifiers that are fast to evaluate and have limited memory requirements. Our last contribution is new image representation for coding layout of image regions. We use Fisher vector principle to code the layout of image regions attributed to a visual word. This representation is much more compact than spatial pyramids of [Lazebnik et al. , 2007], while achieving the same or better level of performance

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (f. IX-87)
  • Annexes : Bibliogr. p. XIV-XIX

Où se trouve cette thèse ?

  • Bibliothèque : Université de Caen Normandie. Bibliothèque universitaire Sciences - STAPS.
  • Non disponible pour le PEB
  • Cote : TCAS-2011-76
  • Bibliothèque : Université de Caen Normandie. Bibliothèque universitaire Sciences - STAPS.
  • Disponible pour le PEB
  • Cote : TCAS-2011-76bis
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.