Reconnaissance de l'ecriture chinoise multifonte par une methode mixte

par SHUSHENG ZHANG

Thèse de doctorat en Sciences appliquées

Sous la direction de ALAIN FAURE.

Soutenue en 1991

à Le Havre .

    mots clés mots clés


  • Résumé

    La reconnaissance de l'ecriture chinoise imprimee monopolice est un sujet tres explore depuis une trentaine annees. Plusieurs difficultes s'y concentrent: une base de donnees volumineuse, un graphisme complexe du caractere individuel, et certains groupes de caracteres tres semblables. Cependant, en matiere de reconnaissance des caracteres chinois multifontes, les etudes sont rares et les resultats imparfaits. Nous proposons et etudions une nouvelle methode mixte de reconnaissance des caracteres chinois multifonte. La methode repose sur une description du caractere par un nuage des points caracteristiques (nuds et extremites) dont les attributs mixtes sont: l'ordre de multiplicite (indice structurel local), et les coordonnees spatiales (parametres geometriques). Un nouvel indice structurel, robuste, somme des indices locaux est utilise comme critere de classification. Les algorithmes de pretraitement (lissage et squelettisation) sont soigneusement choisis de facon a assurer la constance de l'indice, et nous utilisons notamment un ebarbulage selectif inedit. A l'interieur d'une classe, afin de comparer deux nuages de points non ordonnes qui decrivent le caractere saisi et chaque modele, on procede a un appariement par une heuristique rapide et efficace (lors de la phase d'apprentissage, la mise en correspondance est optimale en appliquant l'algorithme hongrois. Le modele retenu est une moyenne des modeles monopolices). Une fonction de similitude, qui decroit avec les distances, est definie; elle tient compte de la dispersion des modeles (cas multifonte) et de la dispersion des points caracteristiques du caractere saisi. Enfin, une caracteristique supplementaire de peripherie est introduite dans le but d'affiner la decision finale. Les experiences effectuees sur une base de donnees de mille caracteres environ par police ont montre un taux de reconnaissance de 98% pour le cas monofonte, et de 96% pour le


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Annexes : 44 REF

Où se trouve cette thèse ?

  • Bibliothèque : Université du Havre. Service commun de la documentation. Bibliothèque centrale.
  • Accessible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.