Contributions au tri automatique de documents et de courrier d'entreprises
Auteur / Autrice : | Djamel Gaceb |
Direction : | Hubert Emptoz, Véronique Eglin |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique. Documents multimédias, images et systèmes d'information communicants |
Date : | Soutenance en 2009 |
Etablissement(s) : | Lyon, INSA |
Ecole(s) doctorale(s) : | École doctorale Électronique, électrotechnique, automatique (Lyon) |
Partenaire(s) de recherche : | Laboratoire : LIRIS - Laboratoire d'Informatique en Image et Systèmes d'information (Rhône2003-....) |
Mots clés
Résumé
Ce travail de thèse s’inscrit dans le cadre du développement de systèmes de vision industrielle pour le tri automatique de documents et de courriers d’entreprises. Les architectures existantes, dont nous avons balayé les spécificités dans les trois premiers chapitres de la thèse, présentent des faiblesses qui se traduisent par des erreurs de lecture et des rejets que l’on impute encore trop souvent aux OCR. Or, les étapes responsables de ces rejets et de ces erreurs de lecture sont les premières à intervenir dans le processus. Nous avons ainsi choisi de porter notre contribution sur les aspects inhérents à la segmentation des images de courriers et la localisation de leurs régions d’intérêt en investissant une nouvelle approche pyramidale de modélisation par coloration hiérarchique de graphes ; à ce jour, la coloration de graphes n’a jamais été exploitée dans un tel contexte. Elle intervient dans notre contribution à toutes les étapes d’analyse de la structure des documents ainsi que dans la prise de décision pour la reconnaissance (reconnaissance de la nature du document à traiter et reconnaissance du bloc adresse). Notre architecture a été conçue pour réaliser essentiellement les étapes d’analyse de structures et de reconnaissance en garantissant une réelle coopération entres les différents modules d’analyse et de décision. Elle s’articule autour de trois grandes parties : une partie de segmentation bas niveau (binarisation et recherche de connexités), une partie d’extraction de la structure physique par coloration hiérarchique de graphe et une partie de localisation de blocs adresse et de classification de documents. Les algorithmes impliqués dans le système ont été conçus pour leur rapidité d’exécution (en adéquation avec les contraintes de temps réels), leur robustesse, et leur compatibilité. Les expérimentations réalisées dans ce contexte sont très encourageantes et offrent également de nouvelles perspectives à une plus grande diversité d’images de documents.