Thèse soutenue

Reconnaissance et classification d’images de documents

FR  |  
EN
Auteur / Autrice : Olivier Augereau
Direction : Jean-Philippe DomengerNicholas Journet
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 14/02/2013
Etablissement(s) : Bordeaux 1
Ecole(s) doctorale(s) : École doctorale de mathématiques et informatique (Talence, Gironde ; 1991-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire bordelais de recherche en informatique
Jury : Président / Présidente : Maylis Delest
Examinateurs / Examinatrices : Nicolas Ragot
Rapporteurs / Rapporteuses : Rémi Mullot, Salvatore-Antoine Tabbone

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Ces travaux de recherche ont pour ambition de contribuer à la problématique de la classification d’images de documents. Plus précisément, ces travaux tendent à répondre aux problèmes rencontrés par des sociétés de numérisation dont l’objectif est de mettre à disposition de leurs clients une version numérique des documents papiers accompagnés d’informations qui leurs sont relatives. Face à la diversité des documents à numériser, l’extraction d’informations peut s’avérer parfois complexe. C’est pourquoi la classification et l’indexation des documents sont très souvent réalisées manuellement. Ces travaux de recherche ont permis de fournir différentes solutions en fonction des connaissances relatives aux images que possède l’utilisateur ayant en charge l’annotation des documents.Le premier apport de cette thèse est la mise en place d’une méthode permettant, de manière interactive, à un utilisateur de classer des images de documents dont la nature est inconnue. Le second apport de ces travaux est la proposition d’une technique de recherche d’images de documents par l’exemple basée sur l’extraction et la mise en correspondance de points d’intérêts. Le dernier apport de cette thèse est l’élaboration d’une méthode de classification d’images de documents utilisant les techniques de sacs de mots visuels.