Explorer pour reconnaître : approche probabiliste pour la reconnaissance visuelle de lieux par un robot mobile

par Hervé Guillaume

Thèse de doctorat en Informatique

Sous la direction de Philippe Tarroux.


  • Résumé

    Dans cette thèse, nous présentons deux modèles de reconnaissance et de catégorisation visuelle de lieux pour la robotique. L’idée centrale est de tirer parti des capacités exploratoires du robot pour améliorer la reconnaissance : contrairement aux approches classiques qui tentent de reconnaître des lieux à partir d’images fixes sans prise en compte de la notion de continuité inhérente aux vidéos, nous insistons sur l’utilité d’intégrer les informations récoltées lors de l’exploration. Les scènes visuelles sont encodées au moyen de descripteurs globaux ou localisés autour d’un focus d’attention. L’architecture attentionnelle développée pour détecter les régions saillantes intègre un module de mémoire spatiale qui permet de déterminer les points les plus robustes dans le flux vidéo. Ce module utilise un champ neuronal pour représenter l’environnement dans un repère géo-centré. Il permet de garder trace des régions de l’espace précédemment fixées et donc de déterminer les plus stables. Les scènes visuelles sont ensuite classées de façon non supervisée au moyen d’une carte auto-organisatrice. Les prototypes visuels obtenus sont ensuite injectés en entrée de deux modèles. Le premier modèle utilise un classificateur bayésien naïf tandis que le second repose sur une approche stochastique, un lieu étant modélisé sous la forme d’une chaîne de Markov dont les états observables correspondent aux différents prototypes visuels. Finalement, bien que l’environnement soit décrit au moyen de quelques prototypes visuels relativement frustes, l’intégration temporelle des informations permet d’atteindre de bonnes performances en reconnaissance et en catégorisation.

  • Titre traduit

    Explore and Recognize: a probabilistic : approach for visual place recognition by a mobile robot


  • Pas de résumé disponible.


  • Résumé

    In this thesis, two models for visual places recognition and categorization for robotics are presented. The main idea is to use the exploratory capacities of a robotic platform to enhance place recognition. Indeed, while classical approaches try to recognize places on fixed and independent images, we emphasise the importance of integrating the information collected during the exploration. Visual scenes are encoded using global descriptors or with local descriptors in the neighbourhood of the focus of attention. The attentional architecture developed to find the salient regions is thus presented. This architecture integrates a spatial memory module which aims to delineate robust salient points in a video stream. This module uses a neural field representing the environment in a geocentric reference frame. It allows the system to keep track of the salient regions and thus to determine the most stable ones. The visual scenes are then classified in an unsupervised way by the mean of a self-organizing map. The resulting visual prototypes are used as input of two classification models. The first one uses a naive Bayes classifier, a place being represented by a collection of visual prototypes. The second one relies on a stochastic model, a place being represented by a Markov chain whose observable states correspond to the visual prototypes. Although we use a few rough visual prototypes to describe the environment, the temporal information integration leads to good performances in terms of recognition and categorization.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (VI-197 p.)
  • Annexes : Bibliogr. p. 187-197

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : 0g ORSAY(2009)109
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.