Structuration intra-programme de contenus TV

par Alina Elma Abduraman

Thèse de doctorat en Signal et images

Sous la direction de Bernard Merialdo.

Soutenue le 21-05-2013

à Paris, ENST , dans le cadre de École doctorale Informatique, télécommunications et électronique (Paris) , en partenariat avec Laboratoire Traitement et Communication de l'Information (Paris) / LTCI (laboratoire) .

Le président du jury était Matthieu Cord.

Le jury était composé de Sid-Ahmed Berrani, Jean Carrive.

Les rapporteurs étaient Guillaume Gravier, Philippe Joly.


  • Résumé

    Les programmes TV possède une structure qui, en général, est perdue quand les programmes sont diffusés. Les programmes qui ont été enregistrés via un enregistreur vidéo personnel ou disponibles via des services comme la TV à la demande, ne peuvent être visionnés que d’une façon linéaire. La navigation y est réalisée en utilisant les fonctions basiques d’avance/retour rapide. Dans ce contexte, la structuration automatique de programmes TV apporte une solution originale. En retrouvant la structure d’origine du programme, elle permet d’offrir aux utilisateurs des outils de navigation originaux. Elle peut également servir pour d’autres applications comme la construction des résumés vidéo, l’indexation et la recherche…Cette thèse s’intéresse ainsi à la structuration automatique des programmes TV. L’objectif est de retrouver automatiquement la structure d’origine d’un programme en déterminant le début et la fin de chaque partie qui le compose. L’approche proposée est complètement non-supervisée et adresse une large catégorie de programmes TV comme les jeux, les magazines, les journaux TV… Cette approche exploite les « séparateurs » qui sont de séquences courtes insérées dans les programmes pour en délimiter les différentes parties. Pour cela, une détection des récurrences audio et visuelles est réalisée sur un ensemble d’épisodes du même programme. Ces récurrences sont ensuite classées à l’aide d’arbres de décision pour en extraire les séparateurs. Les attributs utilisés pour la construction des arbres de décision porte sur la détection des applaudissements, la segmentation en scènes, la détection et le clustering des visages et des locuteurs.

  • Titre traduit

    Unsupervised TV program structuring


  • Résumé

    TV programs have an underlying structure that is lost when these are broadcasted. The linear mode is the only available reading mode when viewing programs recorded using a Personal Video Recorder or through a TV-on-Demand service. The fast-forward/backward functions are the only available tools for browsing. In this context, program structuring becomes important in order to provide users with novel and useful browsing features. In addition to advanced browsing features, TV program structuring can also be used for summarization, indexing and querying, archiving, etc. This thesis addresses the problem of unsupervised TV program structuring. The idea is to automatically recover the original structure of the program by finding the start time of each part composing it. The proposed approach is completely unsupervised and addresses a large category of programs like TV games, magazines, news…. It is based on the detection of “separators” which are short audio/visual sequences that delimit the different parts of a program. To do so, audio and visual recurrences are first detected from a set of episodes of a same program. In order to extract the separators, the recurrences are then classified using decision trees. These are built based on attributes issued from techniques like applause detection, scenes segmentation, face and speaker detection and clustering.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Télécom ParisTech. Bibliothèque scientifique et technique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.