Modélisation du langage naturel appliquée à la reconnaissance de l'écriture manuscrite en-ligne

par Freddy Perraud

Thèse de doctorat en Informatique

Soutenue en 2005

à Nantes .


  • Résumé

    L'évolution de la société de l'Information avec les concepts d'ubiquité, de nomadisme, d'accès à l'information sans discontinuer, en tous lieux et en tous temps, et si possible avec le minimum d'efforts pour l'utilisateur impose de repenser les interfaces de communication. En effet, dans ces situations, la plupart du temps, le clavier n'apporte pas les solutions de confort attendu. L'utilisation de commandes gestuelles, et en particulier de l'écriture manuscrite, se révèle être aujourd'hui une alternative crédible pour ces nouveaux systèmes communicants (assistant numérique, ardoise électronique, etc. ). Les performances des systèmes de reconnaissance actuels sont encore bien inférieures à celles de l'humain notamment dans la prise en compte d'informations contextuelles d'ordre linguistique. Les travaux que nous présentons dans ce manuscrit s'inscrivent dans un cadre industriel (CIFRE) et visent à améliorer le système de reconnaissance de l'écriture manuscrite nommé MyScript Builder, développé par la société Vision Objects. Dans un tel système, la prise en compte des propriétés du langage constitue un élément clé. C'est l'objectif central de ce travail pour lequel encore peu de contributions sont disponibles. Nous avons cherché à concevoir, développer et tester des modèles de langage les plus efficaces possibles pour un système de reconnaissance de l'écriture manuscrite en-ligne. Plusieurs types de contraintes étaient à satisfaire. En articulier, il fallait veiller au compromis taille/performance, mais aussi envisager la portabilité de la méthode afin de pouvoir la généraliser à différentes langues. Ainsi, nous avons privilégié une approche probabiliste basée sur des n-classes pour traiter les langues naturelles. Nous avons expérimenté de nombreuses techniques de classification basées sur différentes méthodes d'exploration de l'espace de recherche et se basant sur un critère de nature contextuelle ou syntaxique. Par ailleurs, des modèles structurels appelés lexiques d'expressions, ont été étudiés pour traiter des entités linguistiques spécifiques. Ces modèles ont fait l'objet d'expérimentations poussées pour évaluer les améliorations apportées au système de reconnaissance MyScript Builder. Sur des phrases appartenant à 13 langues différentes, le taux d'erreur a été diminué de 30 %en moyenne à l'aide de modèles n-classes par rapport à une version ne comportant qu'un simple lexique. Les lexiques d'expressions s'avèrent particulièrement performants puisque le nombre d'erreurs de reconnaissance est réduit de moitié.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (175 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliographie p. 137-146

Où se trouve cette thèse ?

  • Bibliothèque : Université de Nantes. Service commun de la documentation. BU Sciences.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.