Vision monoculaire : contributions théoriques et application à la numérisation des documents

par Frédéric Courteille

Thèse de doctorat en Informatique

Sous la direction de Jean-Denis Durou.

Soutenue en 2006

à Toulouse 3 .


  • Résumé

    Un des problèmes classiques en vision par ordinateur est la reconstruction tridimensionnelle d'une scène à partir d'une seule image. Dans cette thèse, nous nous intéressons à ce problème par le biais de deux méthodes de reconstruction, à savoir le shape from shading et le shape from contour qui utilisent, respectivement, l'information photométrique et une partie de l'information géométrique contenues dans l'image. Dans un premier temps, nous remettons en question certaines des hypothèses nécessaires à ces deux méthodes, afin d'en obtenir des modélisations réalistes. Ceci nous permet, dans un deuxième temps, de généraliser les méthodes de résolution existantes et d'en proposer de nouvelles. Ces contributions théoriques nous amènent à nous intéresser, en guise d'application, à la numérisation des documents. Si le procédé classique, qui utilise un scanner à plat, est satisfaisant pour les situations courantes, il présente deux faiblesses: d'une part, lorsqu'il s'agit d'un livre, la manipulation répétitive consistant à tourner une page puis à plaquer le livre contre la vitre du scanner est relativement fastidieuse; d'autre part, l'image numérisée comporte des défauts (caractères flous ou déformés, effets de parallaxe, papier non encré de couleur non uniforme) si le document est «bombé», comme c'est le cas pour un livre épais. Pour pallier ces deux faiblesses, nous proposons de remplacer le scanner par un appareil photographique numérique, puis de corriger les défauts de la photographie en utilisant l'information tridimensionnelle de la scène. Nous obtenons des résultats très satisfaisants sur images réelles.

  • Titre traduit

    Monovision : theoretical contributions(taxes) and application to documents digitization


  • Résumé

    A classical problem in computer vision is the 3D-reconstruction of a scene from a single image. In this thesis, we consider two 3D-reconstruction methods, namely shape from shading and shape from contour, which use, respectively, the photometric information and a part of the geometric information contained in the image. First, in order to obtain realistic modelings, we put some of the hypotheses necessary to both these methods into question. Second, this allows us to generalize the existing methods of resolution and to design new ones. These theoretical contributions lead us to take an interest in a specific application, namely document digitization. If the traditional process, which uses a flatbed scanner, produces satisfactory results for the current situations, it presents two weaknesses: on the one hand, when dealing with a book, the repetitive handling which consists in turning one page, and then forcing the book sticking to the scanner pane, is rather tedious; in addition, for a curved document, as for example a thick book, some defects will appear in the digital image (blurred or deformed characters, effects of parallax, noninked paper having a non-uniform color). To overcome these two weaknesses, we propose to replace the flatbed scanner by a digital camera, and then to correct the defects of the photograph by using the 3D-shape of the scene. We obtain very satisfactory results on real images.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (139 p.)
  • Annexes : Bibliogr. p. 131-138

Où se trouve cette thèse ?

  • Bibliothèque : Université Paul Sabatier. Bibliothèque universitaire de sciences.
  • Disponible pour le PEB
  • Cote : 2006TOU30202
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.