Reconnaissance globale de mots manuscrits arabes basee sur une recherche avec un dictionnaire

par ALI HOUSSEIN

Thèse de doctorat en Sciences et techniques

Sous la direction de PAVEL GORALCIK.

Soutenue en 1998

à Rouen .

    mots clés mots clés


  • Résumé

    Dans ce document nous decrivons une methode de reconnaissance globale des mots manuscrits arabes. L'acquisition des mots est effectuee par un scanner. Tout d'abord des indices visuels appeles primitives sont choisis sur le mot selon le critere de l'importance de l'information amenee et en privilegiant la facilite de calcul. Ces primitives sont codees par leur nombre d'apparition dans le mot, pour former un vecteur de caracteristiques. La variabilite de l'ecriture donne des vecteurs differents pour le meme mot, mais le codage des primitives peut regrouper des mots non ressemblants avec le meme code. Le vecteur de caracteristiques est choisi avec 7 primitives qui donnent le nombre des traces, des alifs isoles, des boucles, des points situes au-dessus et au-dessous de trace, des hampes et des jambes. Pour generer les vecteurs proches du mot recherche, la variation du nombre des primitives dans le mot est analyse. On evalue le degre de ressemblance des vecteurs proches pour classer les candidats dans une liste selon le nombre de leur primitives. Deux methodes aux performances similaires sont retenues. La premiere est la fonction discriminante qui est une fonction lineaire des ecarts entre le nombre de primitives de deux vecteurs. Les coefficients de cette fonction discriminante sont proportionnels a la variance des primitives. La deuxieme methode est la distance de mahalanobis, qui est une fonction quadratique des ecarts entre le nombre de primitives de deux vecteurs. Les resultats pour les deux methodes sont semblables. Le dictionnaire est construit avec une structure d'arbre binaire de recherche ou chaque nud contient un vecteur de primitives avec l'ensemble des mots qui sont associes a ce vecteur. Le parcours de l'arbre est tres rapide et les comparaisons avec les mots du dictionnaire sont effectues avec le calcul du degre de ressemblance. Tout en ayant un nombre tres faible de modeles dans le dictionnaire, la generation des vecteurs proches nous donne les moyens de rechercher toutes les possibilites. Les resultats sont analyses avec l'augmentation du nombre de modeles de mots des differents scripteurs dans le dictionnaire et en elargissant l'intervalle de recherche.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 150 p.
  • Annexes : 67 ref.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Rouen. Service commun de la documentation. Section sciences site Madrillet.
  • Disponible pour le PEB
  • Cote : 98/ROUE/S049
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.