Thèse soutenue

Contribution aux techniques orientées objet de gestion des séquences vidéo pour les serveurs Web

FR  |  
EN
Auteur / Autrice : Mihaela Scuturici
Direction : Jean-Marie PinonSerge Miguet
Type : Thèse de doctorat
Discipline(s) : Documents multimédias, Images et Systèmes d'Information Communicants (DISIC)
Date : Soutenance en 2002
Etablissement(s) : Lyon, INSA
Ecole(s) doctorale(s) : École doctorale Électronique, électrotechnique, automatique (Lyon)
Partenaire(s) de recherche : Laboratoire : Université Lumière. Equipe de recherche en ingénierie des connaissances (Lyon) - LISI - Laboratoire d'Ingénierie des Systèmes d'Information (Lyon, INSA)

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Nous proposons dans cette thèse une stratégie d’organisation et d’indexation permettant de retrouver et de visualiser d’une manière efficace des séquences vidéos, à l’aide d’un simple navigateur Web. Ces séquences vidéo peuvent provenir d’un seul fichier vidéo ou être issues d’une base de données contenant plusieurs objets vidéo. Un utilisateur souhaitant interroger une base de données vidéo ne peut pas utiliser une requête classique sur des attributs quantitatifs ou qualitatifs. Il peut en revanche baser sa recherche sur : Un mot significatif, ce qui suppose l’existence d’un système d’annotations textuelles ; Une image, ce qui suppose l’existence d’un système de traitement d’images (extraction d’images significatives, extraction des caractéristiques numériques pertinentes à partir d’images, construction des modèles d’annotation à partir de ces caractéristiques numériques, etc. ). Nous avons proposé un système d’annotations textuelles simple, représenté à l’aide de XML. Il permet la recherche d’une séquence vidéo en précisant des mots significatifs, ainsi que la visualisation de cette séquence, en utilisant un navigateur Web. Les annotations textuelles présentent l’inconvénient de devoir être introduites manuellement. Cette opération d’annotation est très coûteuse en temps. Nous proposons donc d’enrichir le système d’annotations textuelles à l’aide d’un système d’indexation semi-automatique basé sur l’analyse des images qui composent la vidéo. L’analyse automatique d’images ne peut cependant fournir dans un premier temps que des caractéristiques de bas niveau (histogramme de couleurs, couleur dominante, etc. – qui sont plutôt des caractéristiques physiques) par rapport aux caractéristiques sémantiques habituellement utilisées par les systèmes d’annotations textuelles. Cette difficulté peut être surmontée si les caractéristiques sémantiques de haut niveau peuvent être déduites des caractéristiques numériques de bas niveau à l’aide de modèles de prédiction obtenus par apprentissage supervisé. Une automatisation du processus d’annotation est dès lors possible pour de nouvelles séquences vidéo après entraînement du système sur un ensemble de séquences annotées manuellement. Nous présentons ensuite l’intégration du système d’indexation avec un système vidéo à la demande (VoD), dans une architecture permettant l’accès direct aux séquences vidéo à travers le Web. Le système d’annotations textuelles et numériques que nous avons proposé s’inscrit comme une méthode efficace d’annotation semi-automatique des séquences vidéo. Les résultats obtenus nous permettent de conclure que l’utilisation des techniques de datamining pour l’indexation des séquences vidéo est une solution viable.