Multiscale integral orientations

par Asim Imdad Wagan

Thèse de doctorat en Informatique graphique et image

Sous la direction de Hubert Emptoz et de Stéphane Bres.

Soutenue en 2010

à Lyon, INSA .


  • Résumé

    This thesis examines and proposes a new set of image region descriptors based on the multiscale localized orientation histograms. The orientation histograms have been proven useful in many image analysis tasks and they have been quite extensively studied in the literature. In this these we have proposed multiscale integral orientations which are a fast multiscale version of the localized orientation histograms. We have also tested the MSIO descriptor on many different image analysis problems and shown the accuracy of this descriptor. In the case of the document image analysis we have tackled with problem of word spotting and writer classification as the test problems for the MSIO descriptor. The results have shown that the feature provide good results and warrant an excellent study on other problems related in the domain of the document image analysis. In the domain of natural image analysis we have tackled the problems of face detection and recognition using the MSIO descriptor. The results there also show the effectiveness of this descriptor. Lastly, we have tested the MSIO descriptor to match 3D models based on their shape similarity with an accuracy of 95%. The results have shown the promising aspect of the MSIO descriptor and we hope to use these descriptors for more work in the image analysis domain


  • Résumé

    Cette thèse porte sur l’analyse d’un nouveau descripteur d’images basé sur la caractérisation de régions à partir d’histogrammes d’orientation multiéchelles. Les histogrammes d’orientation se sont révélés très utiles pour la caractérisation des images dans de nombreuses tâches d’analyse et sont largement étudiés dans la littérature. Nous proposons, dans cette étude, de revisiter cette caractérisation par histogrammes en proposant une version multiéchelle calculée par l’intermédiaire d’images intégrales, afin d’optimiser le coût de calcul sur différentes régions de tailles variables. Ce descripteur basé sur les orientations intégrales multiéchelles, ou MultiScale Integral Orientations (MSIO) a été testé sur différents types de problèmes d’analyse d’images pour mettre en évidence ses caractéristiques et monter son intérêt. Nous avons donc appliqué les MSIO dans le domaine de l’analyse des documents manuscrits, et nous nous sommes plus particulièrement intéressés à la caractérisation de scripteurs et a la recherche de mots (ou Word Spotting) à des fins d’indexation et de recherche par le contenu. Les résultats obtenus ont montré une très bonne capacité de caractérisation de ces formes particulières engendrées par les groupements de caractères et laissent penser que de bons résultats pourraient être obtenus pour d’autres problèmes connexes dans le domaine de l’analyse d’images de documents. Dans le domaine de l’analyse d’images naturelles que nous avons abordé celui de la détection et la reconnaissance de visages en utilisant le descripteur MSIO. Les résultats montrent l à aussi l’efficacité de ce descripteur. Enfin, nous avons utilisé le descripteur MSIO pour la mise en correspondance de modèles 3D à partir de leurs similitudes de forme. Les résultats obtenus sur nos bases de tests ont montré l à encore l’aspect prometteur du descripteur MSIO. Nous continuons à diversifier l’utilisation de ce descripteur à d’autres domaines de l’analyse d’image

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (XIX-138 p.)
  • Annexes : Bibliogr. p. 113-138. Publications de l'auteur p. [VII]-VIII

Où se trouve cette thèse ?

  • Bibliothèque : Institut national des sciences appliquées (Villeurbanne, Rhône). Service Commun de la Documentation Doc'INSA.
  • Disponible pour le PEB
  • Cote : C.83(3571)
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.