Approche mixte pour la reconnaissance des documents imprimes

par Frank Lebourgeois

Thèse de doctorat en Informatique et Automatique Appliquées

Sous la direction de Hubert Emptoz.

Soutenue en 1991

à Lyon, INSA , en partenariat avec RFD - Equipe de Reconnaissance de Forme et Diagnostique (Lyon, INSA) (laboratoire) .


  • Résumé

    L'étude présente un système de reconnaissance multifonte pour documents imprimés, utilisant des informations contextuelles concernant la typographie, la structure du document et la syntaxe. Tout d'abord une méthode ascendante rapide a été réalisée pour séparer le texte des images et reconnaître la structure logique du document. Une approche mixte est utilisée pour reconnaître les caractères isolés. Le premier étage réalise une préclassification automatique des formes identiques de caractères à l' a. Ide d'une construction dynamique d'une bibliothèque de formes. La forte redondance des images des caractères imprimés justifie cette approche. Le second étage reconnaît structurellement les modèles de caractères construits précédemment. Un étage à la fois syntaxique et statistique permet un taux de reconnaissance élevé.

  • Titre traduit

    = A mixed approach for recognition of printed documents


  • Résumé

    A recognition system for multi font printed documents using contextual informations about typography, structure of document and syntax, has been developed. First, a quick bottom up method to separate text from image and recognize logical structure of documents has been achieved. A mixed approach has been used to recognize individual characters. A first stage realizes a compaction at the character level compared to a dynamically built librairy of shapes. The high redundancy of character's image in printed document justifies this approach. A second stage structurally recognizes the previously built models of characters. A mixed syntaxic and statistic stage is used simultanous. It o perform a high recognition rate.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. ( p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr.

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Institut national des sciences appliquées (Villeurbanne, Rhône). Service Commun de la Documentation Doc'INSA.
  • Accessible pour le PEB

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Université Grenoble Alpes (Saint-Martin d'Hères, Isère). Bibliothèque et Appui à la Science Ouverte. Bibliothèque universitaire Joseph-Fourier.
  • Accessible pour le PEB
  • Cote : MF-1991-LEB
  • Bibliothèque : Université Paris-Est Créteil Val de Marne. Service commun de la documentation. Section multidisciplinaire.
  • PEB soumis à condition
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.