Estimation de mouvement et segmentation d'image

par Patrice Brault

Thèse de doctorat en Sciences appliquées. Sciences et technologies de l'information des télécommunications et des systèmes

Sous la direction de Alain Mérigot.


  • Résumé

    La première partie de ce mémoire présente une nouvelle vision de l'estimation de mouvement (EM) dans les séquences vidéo. Nous abordons l'EM à partir de familles d'ondelettes redondantes peu connues et adaptées à différentes transformations, dont, plus particulièrement, la vitesse. Les standards de compression actuels prennent en compte une compression objet mais ne calculent toujours que de simples vecteurs de mouvements de ``blocs''. Nous avons mis en œuvre ces familles d'ondelettes car 1) elles sont construites pour le calcul de paramètres sur plusieurs types de mouvement (rotation, vitesse, accélération). 2) à partir des paramètres de mouvement, nous proposons une approche de l'EM basée sur l'identification des trajectoires des objets. L'approche s'apparente alors à une compression contextuelle, fondée sur une compréhension de la scène. La seconde partie présente deux développements concernant la segmentation non-supervisée dans une approche bayésienne. 1) nous réduisons le temps de segmentation d'une séquence par une mise en oeuvre itérative de la segmentation. Nous montrons l'application à l'EM d'une région segmentée. 2) nous réduisons le temps de segmentation en effectuant la projection de l'image dans le domaine des ondelettes. Ces deux développements sont fondés sur une modélisation de Potts-Markov (PMRF) pour les étiquettes des pixels ou des coefficients d'ondelettes. Ils utilisent un algorithme itératif de type Markov Chain Monte Carlo avec échantillonneur de Gibbs. Enfin, dans l'approche par ondelettes, nous avons développé le modèle de Potts-Markov pour l'adapter aux orientations privilégiées des sous-bandes d'ondelettes.

  • Titre traduit

    Motion estimation and segmentation


  • Résumé

    The first part of this thesis presents a new vision of the motion estimation (ME) in video sequences. We investigate motion estimation with redundant wavelet families tuned to different kind of transformations and, in particular, to speed. Today video compression standards are supposed to realize the compression in an object-based approach, but still compute raw motion vectors on “blocks”. We thus implemented these wavelet families because 1) they are built to perform motion parameter quantization on several kinds of motions (rotation, speed, acceleration) and 2) based on the motion parameters, we can propose an approach of the ME through the identification of the objects trajectories. The global approach is then closer to a contextual compression, based on the understanding of the scene. The second part introduces two new developments on unsupervised segmentation in a Bayesian approach. 1) we reduce the computation time of a sequence through an iterative implementation of the segmentation. We show an application with the ME of a segmented region. 2) We reduce the segmentation time by making the projection of the image in the wavelet domain. These two developments are based on a Potts-Markov modelling (PMRF) for the labels of the pixels and of the wavelet coefficients. They use a Markov Chain Monte Carlo iterative algorithm with a Gibbs sampler. We also develop a Potts model in the wavelet domain to tune it to the specific orientations of the wavelet subbands.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol., 179 p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 151-168. Index

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : 0g ORSAY(2005)336
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.