Thèse soutenue

Segmentation et indexation d'objets complexes dans les images de bandes dessinées

FR  |  
EN
Auteur / Autrice : Christophe Rigaud
Direction : Jean-Christophe Burie
Type : Thèse de doctorat
Discipline(s) : Informatique et applications
Date : Soutenance le 11/12/2014
Etablissement(s) : La Rochelle en cotutelle avec Universitat autònoma de Barcelona
Ecole(s) doctorale(s) : École doctorale Sciences et ingénierie pour l'information, mathématiques (Limoges ; 2009-2018)
Partenaire(s) de recherche : Laboratoire : Laboratoire Informatique, Image, Interaction (La Rochelle)
Jury : Président / Présidente : Bart Lamiroy
Examinateurs / Examinatrices : Jean-Christophe Burie, Bart Lamiroy, Apostolos Antonacopoulos, Simone Marinai, Jean-Philippe Domenger, Nicholas Journet, Dimosthenis Karatzas, Jean-Marc Ogier
Rapporteurs / Rapporteuses : Apostolos Antonacopoulos, Simone Marinai

Résumé

FR  |  
EN

Dans ce manuscrit de thèse, nous détaillons et illustrons les différents défis scientifiques liés à l'analyse automatique d'images de bandes dessinées, de manière à donner au lecteur tous les éléments concernant les dernières avancées scientifiques en la matière ainsi que les verrous scientifiques actuels. Nous proposons trois approches pour l'analyse d'image de bandes dessinées. La première approche est dite "séquentielle'' car le contenu de l'image est décrit progressivement et de manière intuitive. Dans cette approche, les extractions se succèdent, en commençant par les plus simples comme les cases, le texte et les bulles qui servent ensuite à guider l'extraction d'éléments plus complexes tels que la queue des bulles et les personnages au sein des cases. La seconde approche propose des extractions indépendantes les unes des autres de manière à éviter la propagation d'erreur due aux traitements successifs. D'autres éléments tels que la classification du type de bulle et la reconnaissance de texte y sont aussi abordés. La troisième approche introduit un système fondé sur une base de connaissance a priori du contenu des images de bandes dessinées. Ce système permet de construire une description sémantique de l'image, dirigée par les modèles de connaissances. Il combine les avantages des deux approches précédentes et permet une description sémantique de haut niveau pouvant inclure des informations telles que l'ordre de lecture, la sémantique des bulles, les relations entre les bulles et leurs locuteurs ainsi que les interactions entre les personnages.