Thèse soutenue

Reconnaissance de caractères manuscrits : application a la lecture automatique des chèques et des enveloppes postales

FR  |  
EN
Auteur / Autrice : Laurent Heutte
Direction : Yves Lecourtier
Type : Thèse de doctorat
Discipline(s) : Sciences appliquées
Date : Soutenance en 1994
Etablissement(s) : Rouen

Résumé

FR

Cette thèse traite de la reconnaissance de caractères manuscrits provenant de la segmentation d'un mot ou d'une chaîne de caractères numériques dans le contexte particulier de la lecture automatique de chèques et d'enveloppes postales. Le premier chapitre présente un état de l'art dans le domaine de la reconnaissance de l'écrit et notamment les étapes concernant la conception d'un système de reconnaissance de caractères. Le deuxième chapitre traite de la reconnaissance proprement dite. Après une analyse détaillée des différentes méthodes proposées dans la littérature, les deux méthodes retenues, la séparation linéaire et la distance de Mahalanobis, sont décrites. Le troisième chapitre est consacré à la définition des caractéristiques et à la construction du vecteur représentant chaque caractère. Les familles de caractéristiques retenues, incluant à la fois des mesures statistiques et des primitives structurelles, sont détectées à partir de différentes représentations du caractère. Un algorithme de recherche d'une combinaison optimale représentation/famille de caractéristiques est présenté. Le choix de la dimension du vecteur et le problème des composantes manquantes pour certaines observations sont discutés. Le dernier chapitre présente les différentes applications dans lesquelles les travaux de la thèse ont été intégrés. Les deux premières applications concernent la lecture automatique des enveloppes postales américaines et plus spécialement la reconnaissance de graphèmes issus de la segmentation des mots manuscrits cursifs ainsi que la reconnaissance des chiffres provenant de la segmentation du code postal. La troisième application concerne la lecture automatique des chèques postaux français et plus particulièrement la reconnaissance des chiffres issus de la segmentation des deux montants numériques. Les différents aspects de l'étude présentée sont approfondis tant sur le plan bibliographique que sur le plan algorithmique. Ils ont conduit à la mise au point de méthodes de reconnaissance robustes qui ont été validées expérimentalement sur d'importantes bases de caractères et de mots manuscrits