Auteur / Autrice : | Aurélie Lemaitre |
Direction : | Camillerapp, Jean |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2008 |
Etablissement(s) : | Rennes, INSA |
Mots clés
Mots clés contrôlés
Résumé
La vision perceptive humaine combine différents niveaux de perception pour faciliter l'interprétation d'une scène. Les physiologistes la modélisent par le cycle perceptif, guidé par un facteur psychologique, l'attention visuelle. Nous proposons d'utiliser ce principe pour la reconnaissance d'images de documents anciens et manuscrits. Ainsi, nous proposons une architecture générique, DMOS-P, permettant de spécifier des mécanismes de coopération perceptive qui facilitent la description et améliorent la reconnaissance de la structure de documents. Dans les applications, nous mettons en évidence un mécanisme de prédiction/vérification : la vision à basse résolution permet d'émettre des hypothèses sur la structure en utilisant le contexte global, qui ces hypothèses sont ensuite vérifiées à plus haute résolution. Nous avons validé cette approche sur des documents à structure variée (courriers manuscrits, registres d'archives, presse…) et à grande échelle (plus de 80 000 images).