Contributions à la localisation adaptive de zones informatives sur des images de documents
Auteur / Autrice : | Maroua Hammami |
Direction : | Sébastien Adam |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2016 |
Etablissement(s) : | Rouen |
Ecole(s) doctorale(s) : | École doctorale sciences physiques mathématiques et de l'information pour l'ingénieur (Saint-Etienne-du-Rouvray, Seine-Maritime ; ....-2016) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'informatique, de traitement de l'information et des systèmes (Saint-Etienne du Rouvray, Seine-Maritime2006-...) |
Jury : | Rapporteurs / Rapporteuses : Josep Llados i Canet, Jean-Yves Ramel |
Résumé
Nous présentons dans cette thèse nos contributions pour la localisation automatique d’informations dans des images de documents en couleur. Notre objectif est de proposer une solution qui permet de localiser automatiquement une information, préalablement définie par un utilisateur sur un document modèle, dans un flux entrant de documents de la même catégorie. Les documents étant susceptibles de provenir de différentes sources de numérisation dont nous ignorons les caractéristiques, nous proposons de caractériser l’information cible par un positionnement relatif, invariant aux translations et aux changements d’échelle. Le modèle proposé dans ce cadre repose sur un graphe d’adjacence de régions qui décrit l’agencement d’ancres de repérage extraites du document. Le graphe obtenu permet à la fois de décrire l’information recherchée mais aussi la structure du document cible, indépendamment des coordonnées géométriques. Notre seconde contribution est une formulation linéaire en nombres entiers du problème de recherche d’isomorphisme de sous-graphes tolérant aux erreurs. La résolution de cette formulation permet d’extraire le sous-graphe correspondant à l’information recherchée dans le document cible. Enfin, notre troisième contribution concerne l’optimisation des paramètres d’une chaîne de traitement pour améliorer la performance de la localisation de l’information. L’approche proposée, qui repose sur un algorithme évolutionnaire, permet au système de s’adapter automatiquement à la classe de document traitée.