Détection automatique des mouvements de caméra et des régions de textes pour la structuration et l'indexation de documents audiovisuels

par Hae-Kwang Kim

Thèse de doctorat en Informatique

Sous la direction de Philippe Aigrain.

Soutenue en 1997

à Toulouse 3 .

    mots clés mots clés


  • Résumé

    Le travail de recherche presente dans le rapport de these a pour perspective la proposition d'une interface utilisateur basee sur la manipulation directe d'un document audiovisuel. Dans un premier temps, nous traiterons les caracteristiques et les activites autour des documents audiovisuels et les problematiques generales du traitement informatique des documents audiovisuels. Ensuite, nous presenterons differents interface utilisateurs de la manipulation des documents audiovisuels. Pour realiser ces interfaces utilisateurs, les documents audiovisuels doivent etre prealablement structures et indexes. Du fait des difficultes de la structuration et l'indexation par l'etre humain (la quantite immense de donnees, le cout de la main d'uvre, la subjectivite et la nature monotone et fatigante des travaux), des methodes automatiques et efficaces sont demandees. Nous verrons les differents travaux de la structuration et l'indexation des documents audiovisuels. La detection des mouvements de camera est importante pour l'indexation parce qu'ils sont souvent charges de significations semantiques et participent au langage cinematographique en exprimant les intentions du realisateur et du cameraman. De meme, la micro-segmentation d'un plan par les segments de mouvements de camera homogenes est utile pour la structuration en permettant une manipulation plus souple et plus detaillee des documents audiovisuels. Nous presenterons une methode efficace de detection automatique des mouvements de camera utilisant des images spatio-temporelles appelees image x-ray simplifiee suivant des concepts introduits par y. Tonomura et al. Les images de texte (sous-titres, inter-titres, etc) dans les documents audiovisuels portent des informations linguistiques tres importants et nous presenterons une methode automatique et efficace de detection et location pour l'acces base sur le contenu de documents audiovisuels et son application

  • Titre traduit

    Automatic detection of camera work and text regions for structuring and indexing audiovisual documents


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 253 f

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Paul Sabatier. Bibliothèque universitaire de sciences.
  • Disponible pour le PEB
  • Cote : 1997TOU30020

Cette version existe également sous forme de microfiche :

  • Bibliothèque : Université Grenoble Alpes (Saint-Martin d'Hères, Isère). Bibliothèque et Appui à la Science Ouverte. Bibliothèque universitaire Joseph-Fourier.
  • Accessible pour le PEB
  • Cote : MF-1997-KIM
  • Bibliothèque : Université Paris-Est Créteil Val de Marne. Service commun de la documentation. Section multidisciplinaire.
  • PEB soumis à condition
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.