Thèse soutenue

Contributions à la localisation adaptive de zones informatives sur des images de documents

FR
Auteur / Autrice : Maroua Hammami
Direction : Sébastien Adam
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2016
Etablissement(s) : Rouen
Ecole(s) doctorale(s) : École doctorale sciences physiques mathématiques et de l'information pour l'ingénieur (Saint-Etienne-du-Rouvray, Seine-Maritime ; ....-2016)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique, de traitement de l'information et des systèmes (Saint-Etienne du Rouvray, Seine-Maritime2006-...)
Jury : Rapporteurs / Rapporteuses : Josep Llados i Canet, Jean-Yves Ramel

Résumé

FR  |  
EN

Nous présentons dans cette thèse nos contributions pour la localisation automatique d’informations dans des images de documents en couleur. Notre objectif est de proposer une solution qui permet de localiser automatiquement une information, préalablement définie par un utilisateur sur un document modèle, dans un flux entrant de documents de la même catégorie. Les documents étant susceptibles de provenir de différentes sources de numérisation dont nous ignorons les caractéristiques, nous proposons de caractériser l’information cible par un positionnement relatif, invariant aux translations et aux changements d’échelle. Le modèle proposé dans ce cadre repose sur un graphe d’adjacence de régions qui décrit l’agencement d’ancres de repérage extraites du document. Le graphe obtenu permet à la fois de décrire l’information recherchée mais aussi la structure du document cible, indépendamment des coordonnées géométriques. Notre seconde contribution est une formulation linéaire en nombres entiers du problème de recherche d’isomorphisme de sous-graphes tolérant aux erreurs. La résolution de cette formulation permet d’extraire le sous-graphe correspondant à l’information recherchée dans le document cible. Enfin, notre troisième contribution concerne l’optimisation des paramètres d’une chaîne de traitement pour améliorer la performance de la localisation de l’information. L’approche proposée, qui repose sur un algorithme évolutionnaire, permet au système de s’adapter automatiquement à la classe de document traitée.