Thèse soutenue

Recherche par thésaurus visuel et composition spatiale dans les bases d'images

FR  |  
EN
Auteur / Autrice : Mohamed Hichem Houissa
Direction : Nozha Boudjemaa
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2007
Etablissement(s) : Paris 11
Partenaire(s) de recherche : autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne)

Résumé

FR  |  
EN

Les systèmes usuels proposent à l'utilisateur de sélectionner une image ou une région requête soit tirée de la base soit issue d'une collection externe. Nous nous sommes penchés sur le cas où l'exemple n'existe pas ou n'est pas approprié à l'image mentale que se fait l'utilisateur d'une cible donnée. Le paradigme du Thésaurus Visuel permet de générer des catégories de régions segmentées dont les représentants sont proposés comme une page zéro à l'utilisateur pour composer sa requête mentale en sélectionnant les patchs visuels à sa guise. Nous nous sommes intéressés dans ce travail à la génération des résumés visuels des bases d'images selon la complexité des régions et suivant les schémas de descriptions associés. La segmentation grossière des images génère des composantes visuelles dont la description par des attributs photométriques globaux tels que des distributions de couleurs quantifiées ne permet pas d'englober toute l'information photométrique sous-jacente. Les descripteurs locaux extraits autour des points d'intérêt de Harris complètent le schéma de description global et infèrent une robustesse à la catégorisation des régions. Cette dernière fait appel à des algorithmes de compétition agglomérative et d'autres relationnels couplés à des mesures de similarité non-traditionnelles pour obtenir des catégories de régions visuellement et structurellement cohérentes. Cette nouvelle approche est exploitée pour la composition logique et spatiale des patchs pour satisfaire la requête mentale de l'utilisateur. Les items de la page zéro sont les représentants des catégories de régions dont l'orientation spatiale relative est décrite au moyen d'un histogramme angulaire pondéré qui s'adapte à la régularité et à la distribution des pixels dans la région. Les requêtes se décomposent en une partie logique et une autre spatiale dont les résultats sont retournés en utilisant des tables d'associations et des intersections d'histogrammes respectivement.