Thèse soutenue

Reconnaissance d’expressions mathématiques manuscrites guidée par le contexte
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Frank D. Julca-Aguilar
Direction : Christian Viard-GaudinNina S. T. HirataHarold Mouchère
Type : Thèse de doctorat
Discipline(s) : Informatique et applications
Date : Soutenance en 2016
Etablissement(s) : Université Bretagne Loire (2016-2019) en cotutelle avec São Paulo
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et mathématiques (Nantes)
Partenaire(s) de recherche : Laboratoire : Institut de recherche en communications et cybernétique (Nantes) - Instituto de Matemática e Estatística (São Paulo)
Jury : Examinateurs / Examinatrices : Christian Viard-Gaudin, Nina S. T. Hirata, Harold Mouchère, Jean-Yves Ramel, Ricardo Da Silva Torres
Rapporteurs / Rapporteuses : Jean-Yves Ramel, Ricardo Da Silva Torres

Résumé

FR  |  
EN

Les expressions mathématiques manuscrites en-ligne sont constituées d'une séquence de traces. Leur reconnaissance nécessite de résoudre trois problèmes fondamentaux: la segmentation de ses symboles, leur reconnaissance et l'analyse structurelle de l'expression (i. E. L'identification des relations spatiales intersymboles). La nature ambiguë des expressions manuscrites et leur structure spatiale sont les problèmes principaux du processus de reconnaissance. Dans cette thèse, nous proposons une modélisation du problème par une analyse syntaxique de graphes. La description des règles de production grammaticales par des graphes permet de modéliser directement la nature non linéaire des structures. Notre algorithme d'analyse détermine récursivement les partitions des traces en respectant les graphes des règles de production. Pour diminuer le coût de calcul, graphes issus des partitions sont limitées à un ensemble d'hypothèses de symboles et de relations précalculées grâce à classifieur entraîné. Ce classifieur donne à chaque hypothèse un ensemble d'étiquettes associées à leur vraisemblance. C'est l'analyse syntaxique qui sélectionnera la meilleure interprétation globale. Cette analyse produit de plusieurs arbres syntaxiques pour représenter plusieurs interprétations, leur associe un coût et choisit l'arbre avec le coût le plus faible pour l'interprétation finale. Les évaluations effectuées sur une base d'expressions conséquente et publique ont permis de montrer que notre approche est plus performantes que plusieurs méthodes de l'état de l'art et que l'utilisation du graphe d'hypothèses de symboles et de relations permet de contrôler la complexité de l'analyse. L'adaptation à d'autres langages graphiques est possible.