Reconnaissance de l'écriture manuscrite : analyse de la forme globale des mots et utilisation de la morpho-syntaxe

par Christophe Parisse

Thèse de doctorat en Informatique

Sous la direction de Joseph Mariani.

Soutenue en 1989

à Paris 11 .


  • Résumé

    La reconnaissance de l'écriture par un ordinateur et par un être humain (la lecture) présentent beaucoup de points communs. C'est pourquoi l'observation de la lecture a permis d'aborder d'une manière nouvelle le problème non résolu de la reconnaissance d 'une écriture manuscrite quelconque. Un système dont le but est une reconnaissance mono-scripteur sur un lexique de 10000 mots a été réalisé et testé. S'inspirant des recherches sur la lecture, ce système fait coopérer une analyse globale de la forme du mot, des traitements syntaxiques et un calcul de proximités lexico­ sémantiques. La reconnaissance morphologique utilise des transformations d'images de mots digitalisées permettant d’effectuer des comparaisons de forme globales. Ces transformations traduisent la forme globale de l'objet constitué par le mot indépendamment de sa structure interne (enchevêtrement des formes élémentaires qui le constitue). Ceci permet d'effectuer des comparaisons de forme à l'intérieur d’une écriture donnée quelle que soit celle-ci. Un analyseur syntaxique basé sur un modèle markovien à apprentissage permet d 'évaluer la grammaticalité des phrases proposées à l'issue de la reconnaissance morphologique. Les phrases grammaticalement correctes sont sémantiquement pondérées à l'aide d 'un calcul de cooccurrences lexicales effectué sur des bases textuelles thématiques.

  • Titre traduit

    Machine recognition of handwriting : global analyses of word shapes and morpho-syntactic evaluation


  • Résumé

    Machine recognition of handwriting: global analyses of word shapes and morpho-syntactic evaluation,Machine recognition of handwriting aims at a goal which is not far-removed from human reading. The study of reading may thus provide uscful hints to as yet unsuccessful computer recognition of unrestricted handwriting. A writer oriented system (for a 10000 word vocabulary) has been developed in this framework and tested. It operates on the basis of interaction of full-word shape analyses and syntactic and lexical-semantic processing. The system comprises:• 1 mage transformations designed so as to enable global shape comparisons of scanned words. These transformations reOect the global shape of word images and not their internal structure thereby permitting to conduct shape comparisons within a given unrestricted handwriting. • A syntactic parser based on a markovian mode! whose rules emerge through training. Lt checks the grammaticality of candidate sentences which result from shape comparisons. • Semantic weighting of sen. Tences which are found grammatical. Lt is based on computing lexical co-occurrences in thematically organized textual data-bases.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (170 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 159-170

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : 0g ORSAY(1989)301
  • Bibliothèque : Centre Technique du Livre de l'Enseignement supérieur (Marne-la-Vallée, Seine-et-Marne).
  • Disponible pour le PEB
  • Cote : TH2014-035576
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.