Segmentation et classification de mots en reconnaissance optique de textes manuscrits

par Thierry Paquet

Thèse de doctorat en Sciences appliquées

Sous la direction de YVES LECOURTIER.

Soutenue en 1992

à Rouen .

    mots clés mots clés


  • Résumé

    Les travaux presentes dans ce memoire abordent les differentes etapes necessaires a la realisation d'un logiciel de reconnaissance optique de texte manuscrit provenant d'un scripteur quelconque, dans le cadre d'une application a vocabulaire limite: la lecture automatique des montants litteraux presents sur des cheques bancaires ou postaux. La localisation des mots dans l'image binarisee, premiere etape du traitement, est realisee par une methode d'analyse descendante. De cette facon, il est possible de determiner au cours du traitement des parametres utiles pour les traitements suivants: hauteur des corps de ligne, positions des lignes de base, positions des extensions des corps de ligne. Un modele structurel global des mots manuscrits cursifs constitue des particularites locales rencontrees dans le mot autour de l'axe median est propose. Celui-ci constitue une alternative au modele analytique en lettres separees generalement utilise. L'extraction des caracteristiques dans l'image du mot est effectue par un algorithme de suivi de trait qui permet l'etiquetage direct des elements caracteristiques selon le modele envisage lors dans la progression dans le trait vu comme un graphe de zones. La discrimination des 30 mots du vocabulaire etudie s'effectue en deux etapes. Un critere d'aspect prenant en compte les extensions du corps de ligne et la longueur du mot permet tout d'abord de rejeter les mots du dictionnaire d'aspects fondamentalement differents. Les candidats retenus sont ensuite classes en evaluant une distance d'edition entre le graphe de traits extraits et les graphes de reference des mots candidats codes en chaine de graphemes. L'utilisation de regles de substitution etendues permet la prise en compte de configurations proches et notamment des liaisons entre lettres. Les resultats presentes, issus de tests effectues sur des donnees de laboratoire et d'images de cheques, laissent augurer de bonnes performances sur des bases de donnees importantes par la mise en place d'une strategie de lecture qui n'est pas envisagee dans ce travail


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Où se trouve cette thèse ?

  • Bibliothèque : Université de Rouen. Service commun de la documentation. Section sciences site Madrillet.
  • Disponible pour le PEB
  • Cote : 92/ROUE/S007
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.