Thèse soutenue

Construction automatique de résumés vidéos

FR  |  
EN
Auteur / Autrice : Itheri Yahiaoui
Direction : Bernard Merialdo
Type : Thèse de doctorat
Discipline(s) : Signal et image
Date : Soutenance en 2003
Etablissement(s) : Paris, ENST

Résumé

FR  |  
EN

La croissance rapide des documents multimédia, comme par exemple l'énorme flux de vidéos qui se trouvent sur les ordinateurs personnels et autres équipements, nécessite le développement de nombreux outils pour leur manipulation. La création automatique de résumés vidéos est un outil performant qui permet de résumer le contenu général de la vidéo et de ne présenter que les parties les plus pertinentes. A travers cette thèse, nous proposons une nouvelle approche de construction et d évaluation automatique des résumés vidéos. Cette approche est basée sur un principe que nous proposons et que nous dénommons "Principe de Reconnaissance Maximale ". Ce dernier est dérivé d'une tâche réaliste prédéfinie qui consiste à l'identification de l'origine d'un extrait donné ayant uniquement connaissance d'un résumé. Notre méthode de construction est un processus d'optimisation, par rapport au Principe de Reconnaissance Maximale PRM, qui permet de construire le meilleur résumé possible pour aider l'utilisateur dans l'accomplissement de cette tâche d'identification. Le meilleur résumé est celui qui maximise le nombre de réponses correctes données par l'utilisateur. Cette technique peut être utilisée pour la création de résumés de différents types de média. Dans cette thèse, nous avons adopté de PRM pour proposer différentes méthodes de création de résumés selon le ou les média pris en considération. En premier lieu, nous avons présenté une première méthode de construction de résumés vidéos en utilisant uniquement les informations visuelles, puis nous avons étudié différentes autres méthodes de construction multi-vidéos. Ensuite, nous avons illustré l'adaptation de ce principe pour la construction de résumés basés exclusivement sur les informations textuelles. Enfin, nous avons proposé une méthode mixte de construction de résumés vidéo-textuels en combinant conjointement lors du processus d'optimisation les inforamtions visuelles et textuelles