Contribution à la caractérisation des images par transformée polynomiale : application à l'indexation des images et des vidéos

par Carlos Joel Rivero Moreno

Thèse de doctorat en Informatique

Sous la direction de Jean-Michel Jolion et de Stéphane Bres.

Soutenue en 2005

à Villeurbanne, INSA .


  • Résumé

    Ce travail de thèse porte sur l'indexation d'images et de vidéos, basée sur l'extraction de primitives. Dans ce cadre, nous nous sommes intéressés aux différentes transformées construites à partir de polynômes, et plus particulièrement aux transformées de Hermite et de Laguerre (construites à partir des polynômes de Hermite et de Laguerre). Notre approche fait une place importante à la perception visuelle humaine par le choix de la transformée de Hermite, puisqu'un certain nombre d'études ont montré de grandes similitudes entre le fonctionnement de la vision humaine (perception, filtrages, choix des informations importantes. . . ) et les grandeurs mises en évidence par cette transformée. Par ailleurs, la dimension temporelle de la vidéo est le plus souvent traitée au même titre et avec les mêmes outils que les deux dimensions spatiales. Il nous a paru intéressant de faire une distinction à ce niveau puisque le temps et l'espace diffèrent au moins sur un aspect important: la causalité. Cette distinction a été faite par le choix de polynômes différents pour l'espace et pour le temps. Pour cela, nous avons choisi la transformée de Laguerre, construite à partir des polynômes de Laguerre, pour le traitement de la dimension temporelle. Dans un premier temps, nous présentons une analyse théorique des filtres de Hermite et leurs liens avec les filtres de Gabor comme modèles du système visuel humain. Ensuite, dans le cadre de l'indexation d'images, nous nous sommes intéressés plus particulièrement à la texture et à l'extraction de ses caractéristiques par filtrage. Dans cette démarche, et afin d'améliorer la discrimination des caractéristiques de texture résultant de l'application de ces filtres, nous proposons le banc de filtres de Hermite type Gabor. Ceux-ci ont la même structure que les filtres de Hermite mais avec une décomposition fréquentielle similaire à celle des filtres de Gabor. Nous proposons ensuite deux approches, une globale et l'autre locale, pour l'indexation d'images texturées basée sur des mesures d'autocorrélation à la sortie des ces filtres. Enfin, dans le cadre des vidéos, nous proposons une approche d'indexation basée sur la combinaison d'informations spatiales et temporelles, extraites séparément des séquences vidéo. Dans la version spatiale, nous utilisons les filtres de Hermite et dans la version temporelle, les filtres de Laguerre qui préservent la causalité. Par intégration des deux modèles, nous construisons un système d'indexation spatio-temporel.

  • Titre traduit

    Contribution to image characterization by polynomial transform : Application to image and video indexing


  • Résumé

    This thesis work concerns indexing of images and videos, based on the extraction of primitives. In this context, we are interested in the different transforms based on polynomials, more particularly in the Hermite and Laguerre transforms (based on Hermite and Laguerre polynomials). Human visual perception takes an important place in our approach by choosing the Hermite transform, since some studies have showed great similarities between the operation of the human vision (perception, filtering, choice of important information …) and the measurable quantities highlighted by this transform. In addition, the temporal dimension of video is generally processed on the same basis and with the same tools as the two spatial dimensions. Then, it seems to be interesting to make a distinction on this way since time and space differ at least on an important aspect: causality. We have made this distinction by the choice of different polynomials for space and time. For that doing, we chose the Laguerre transform, based on Laguerre polynomials, for processing the temporal dimension. First, we present a theoretical analysis of Hermite filters and their links to Gabor filters as models of the human visual system. Next, in the framework of image indexing, we are interested more particularly to texture and its feature extraction by filtering. In this step, in order to improve discrimination of texture features resulting from applying these filters, we propose the Gabor-like Hermite filter bank. These ones have the same structure as Hermite filters but with a similar frequency decomposition than that performed by Gabor filters. We propose then two approaches, one global and other local, for texture image indexing based on autocorrelation measures at the output of these filters. Finally, in the framework of videos, we propose an indexing approach based on the combination of spatial and temporal information, which are extracted separately from video sequences. We use Hermite filters for the spatial version and Laguerre filters, which preserve causality, for the temporal version. By integration of the two models, we build a spatio-temporal indexing system.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (VIII-183 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p.171-182

Où se trouve cette thèse ?

  • Bibliothèque : Institut national des sciences appliquées (Villeurbanne, Rhône). Service Commun de la Documentation Doc'INSA.
  • Disponible pour le PEB
  • Cote : C.83(2960)
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.