Thèse soutenue

Description sémiotique de contenus audiovisuels
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Jean-Pascal Martin
Direction : Gérard Sabah
Type : Thèse de doctorat
Discipline(s) : Informatique. Sciences cognitives
Date : Soutenance en 2005
Etablissement(s) : Paris 11
Partenaire(s) de recherche : autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne)

Résumé

FR  |  
EN

Trois catégories d'éléments de description du contenu sont nécessaires pour la description d'un Document AudioVisuel (DAV) : les objets montrés, les procédés de mise en image et les relations diégétiques. L'identification des relations diégétiques (ie celles de l'univers spatio-temporel désigné par le récit) ne peut être automatisée. Les formalismes de la communauté utilisent des descripteurs sémantiques difficiles à sélectionner puisqu'ils dépendent d'éléments contextuels interprétés d'après des connaissances élaborées. Nous choisissons de garder l'homme dans la chaîne d'indexation pour répondre à ce constat. Deux éléments de réponse sont fournis. Premièrement, nous proposons une méthode d'indexation sémiotique fondée sur l'identification et l'explicitation des signes réifiés lors de l'analyse. Pour cela, nous définissions le signe tétraédrique qui est une représentation cognitive composée nécessairement d'un signifié et d'un signifiant et éventuellement de référents intensionnels et extensionnels. Nous définissions ensuite l'interprétation comme une réécriture sémiotique. Les graphes de signes sont proposés comme corrélats de l'activité mentale et peuvent être opérationnalisés par des schémas (RDF+OWL) servant d'extension à MPEG-7. Deuxièmement, nous préconisons un modèle d'interaction opérative entre l'homme et le système outillant la réification de l'interprétation. Une plateforme pour la construction de graphes de signes fondée sur le paradigme multi-agents permet la construction dynamique et négociée de signes exprimés selon une syntaxe et une grammaire fournie. Des schémas d'interprétation fournissent aux agents des micros interprétations activables en contexte.