Auteur / Autrice : | Grégoire Lefebvre |
Direction : | Jean-Marc Salotti, Christophe Garcia |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences cognitives |
Date : | Soutenance en 2007 |
Etablissement(s) : | Bordeaux 2 |
Partenaire(s) de recherche : | Entreprise : France Télécom R&D (2001-2007) |
Jury : | Président / Présidente : Hubert Cardot |
Examinateurs / Examinatrices : Jean-Marc Salotti, Christophe Garcia, Hubert Cardot, Jean Ponce, Mohamed Daoudi, Patrick Gros | |
Rapporteurs / Rapporteuses : Jean Ponce, Mohamed Daoudi |
Mots clés
Mots clés contrôlés
Résumé
Les travaux effectués dans le cadre de cette thèse portent sur la classification automatique des images numériques en fonction de leur contenu visuel. L'objectif est d'assigner à une image de test une identité parmi celles d'un ensemble de catégories connues. Pour cela, on cherche à extraire un ensemble de signatures visuelles parcimonieuses, qui lui soit spécifique, puis à sélectionner et structurer l'information discriminante, avant de proposer une classification adaptée à leur nature et à l'application visée. De nombreuses méthodes ont été proposées dans la littérature pour décrire le contenu visuel des images. Parmi les plus efficaces, on compte les techniques d'extraction de points d'intérêt et de descriptions des singularités locales. Ce travail reprend ce principe et propose de nouvelles techniques de sélection et de fusion de signatures locales, basées sur l'analyse de cartes de neurones auto-organisatrices. Un nouveau support de l'information du contenu visuel est alors proposé comme étant l'activation d'un modèle neuronal multimodal. Les méthodes proposées permettent de se focaliser sur les éléments spécifiques d'une catégorie, vis-à-vis des autres catégories en compétition. Elles permettent ainsi une certaine robustesse aux changements de prises de vue, aux variations d'illumination et aux occultations partielles. Les techniques proposées sont évaluées et comparées aux approches usuelles selon des protocoles expérimentaux rigoureux. Les résultats ainsi obtenus montrent les très bonnes performances des approches introduites dans les domaines de la classification d'images, de la reconnaissance de visages et du filtrage de contenus tendancieux.