Modèle de Markov caché multidimensionnelle [sic] appliqué aux images et à l'analyse vidéo

par Joakim Söderberg

Thèse de doctorat en Signal et images

Sous la direction de Bernard Merialdo.

Soutenue en 2007

à Paris, ENST .


  • Résumé

    Les progrès récents dans les domaines de la vision cognitive, des multimédia, de l interaction homme-machine, des communications et de l Internet sont un apport considérable pour la recherche qui profite à l imagerie et l analyse vidéo. Des systèmes adaptés et fiables sont nécessaires pour l analyse, l indexation et le résumé de grandes quantités de données audiovisuelles. Les méthodes traditionnelles de classification d images procèdent par analyse des blocs distincts d une image, ce qui aboutit à un formalisme non contextuel des caractéristiques visuelles. Les approches récentes tendent donc de plus en plus vers une vision globale de l image incluant sa structure et sa forme générale. Cette thèse est une approche statistique issue de l intelligence artificielle visant à une représentation séquentielle des données de l image. Cette représentation statistique permet l estimation, à la classification, et à la segmentation de l image. Nous utilisons un nouvel algorithme efficace représentant les images à l aide du modèle bidimensionnel de Markov caché (HMM). La principale difficulté à appliquer un 2-D HMM aux images est la complexité algorithmique qui s’accroît de façon exponentielle avec le nombre de segments d image. En conséquence, la contribution technique majeure de cette thèse est d estimer les paramètres d un 2­D HMM la complexité sera O(whN^2) au lieu de O(wN^2h) où N est le nombre d’états dans le modèle et (w,h) sont respectivement la largeur et la hauteur de l image. Nous démontrons que la formalisation DT HMM présente plusieurs possibilités d extensions, par une étude du segmentation d’image, classification et 3-D HMM.

  • Titre traduit

    Multidimensional hidden Markov model applied to image and video analysis


  • Résumé

    Recent progress and prospects in cognitive vision, multimedia, human-computer interaction, communications and the Web call for, and can profit from applications of advanced image and video analysis. Image classification is perhaps the most important part of digital image analysis. The objective is to identify and portray the visual features occurring in an image in terms of differentiated classes or themes. Traditional classification methods analyses independent blocks of an image, which results in a context-free formalism. However there is a fairly wide-spread agreement that observations should be presented as collections of features which appear in a given mutual position or shape. We therefore employ a new efficient algorithm that models context in images by a 2-D hidden Markov model (HMM). The difficulty with applying a 2-D HMM to images is the computational complexity which grows exponentially with the number of image blocks. The main technical contribution of this thesis is a way of estimating the parameters of a 2-D HMM in O(whN^2) complexity instead of O(wN^2h), where N is the number of states in the model and (w,h) is the width respectively height of the image. We investigate the performance of our proposed model (DT HMM) , and search for its point of operation. In an effort to introduce both global and local context in the model, the DT HMM was extended to multiple image resolutions. The results indicate that earlier recorded deficiency can be conquered and that its performance can be compared with other known algorithms. We finally demonstrate the versatility of the model by presenting applications such as; classification, segmentation and object tracking.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (133 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : 125 réf. bibliogr. Résumé étendu en français

Où se trouve cette thèse ?

  • Bibliothèque : Télécom ParisTech. Bibliothèque scientifique et technique.
  • Disponible pour le PEB
  • Cote : 7.345 SODE
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.