Optimisation de modeles markoviens pour la reconnaissance de l'ecrit

par MANUEL AVILA

Thèse de doctorat en Sciences appliquées

Sous la direction de Christian Olivier.

Soutenue en 1996

à Rouen .

    mots clés mots clés


  • Résumé

    Cette these traite de l'optimisation de modeles markoviens dedies a la reconnaissance de textes manuscrits, dans le cas particulier d'une application a vocabulaire reduit : la lecture des montants litteraux de cheques. Le premier chapitre decrit brievement les techniques utilisees pour la reconnaissance de l'ecrit. Nous presentons egalement les descriptions des mots que nous avons utilisees. Le second chapitre presente les modeles de markov cache. Nous presentons notamment les differents niveaux de representation du probleme de la lecture de l'ecrit dans le cas de modelisations markoviennes : les niveaux phrase, mot et lettre. Finalement, nous presentons les algorithmes couramment utilises pour exploiter des modeles de markov : les algorithmes de viterbi et de baum-welch, avec des variantes que nous avons adaptees a nos besoins. Dans le troisieme chapitre, nous traitons du probleme d'une optimisation des descriptions des mots. Nous donnons trois methodes de representation des mots. Nous presentons ensuite une methode de recherche de l'ordre optimal d'un processus de markov basee sur la minimisation de criteres d'information de type akaike soit aic, bic et. Finalement, nous comparons les resultats des trois alphabets pour les ordres de 1 a 3. Ceci nous permet de valider le choix de la description des mots et de l'ordre du modele de markov correspondant. Nous reutilisons ces resultats au chapitre 4. Dans ce chapitre, trois approches sont proposees pour la reconnaissance des mots : la premiere est une approche globale qui par definition ne s'attache pas a l'identification des lettres, la seconde est une approche analytique basee sur une modelisation completement explicitee, la troisieme methode est une approche pseudo-analytique intermediaire entre les deux approches precedentes. Elle modelise le mot de maniere analytique en utilisant des modeles globaux de lettres. Finalement, les resultats de ces trois methodes sont ensuite fusionnes : chapitre 5. Ce chapitre traite de l'identification des montants litteraux de cheques. La strategie developpee se decompose en trois parties : validation de la segmentation des mots, identification des mots et reconstitution de la phrase. A chaque partie correspond une modelisation markovienne adaptee.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 218 P.
  • Annexes : 120 REF.

Où se trouve cette thèse ?

  • Bibliothèque : Université de Rouen. Service commun de la documentation. Section sciences site Madrillet.
  • Disponible pour le PEB
  • Cote : 96/ROUE/S034
  • Bibliothèque : Ecole Polytechnique de l’Université François Rabelais . Départements Electronique et Energie, Informatique, Mécanique et Systèmes. Centre de documentation.
  • Accessible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.