Amélioration de la détection des concepts dans les vidéos en coupant de plus grandes tranches du monde visuel

Usman Niaz

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

FR |

EN

Auteur / Autrice :	Usman Niaz
Direction :	Bernard Merialdo
Type :	Thèse de doctorat
Discipline(s) :	Signal et images
Date :	Soutenance le 08/07/2014
Etablissement(s) :	Paris, ENST
Ecole(s) doctorale(s) :	École doctorale Informatique, télécommunications et électronique de Paris
Partenaire(s) de recherche :	Laboratoire : Laboratoire Traitement et communication de l'information (Paris ; 2003-....)
Jury :	Président / Présidente : François Brémond
	Examinateurs / Examinatrices : Georges Linarès
	Rapporteurs / Rapporteuses : Philippe-Henri Gosselin, Georges Quénot

Mots clés

FR |

EN

Mots clés contrôlés

Vidéo numérique

Traitement d'images

Mots clés libres

Recherche d'image par le contenu

Sac de mots

Analyse d'image

Indexation video

Algorithme co-training

Résumé

FR |

EN

Les documents visuels comprenant des images et des vidéos sont en croissance rapide sur Internet et dans nos collections personnelles. Cela nécessite une analyse automatique du contenu visuel qui fait appel à la conception de méthodes intelligentes pour correctement indexer, rechercher et récupérer des images et des vidéos. Cette thèse vise à améliorer la détection automatique des concepts dans les vidéos sur Internet. Nos contributions portent sur des différents niveaux dans le cadre de détection de concept et peuvent être divisés en trois parties principales. La première partie se focalise sur l’amélioration du modèle de représentation des vidéos « Bag-of-Words (BOW) » en proposant un nouveau mécanisme de construction qui utilise des étiquettes de concepts et une autre technique qui ajoute un raffinement à la signature BOW basée sur la distribution de ses éléments. Nous élaborons ensuite des méthodes pour intégrer des entités semblables et dissemblables pour construire des modèles de reconnaissance améliorés dans la deuxième partie. A ce stade-là, nous observons l’information potentielle que les concepts partagent et construisons des modèles pour les méta-concepts dont sont dérivés les résultats spécifiques de concepts. Cela améliore la reconnaissance des concepts qui ont peu d’exemples annotés. Enfin, nous concevons certaines méthodes d'apprentissage semi-supervisé pour bénéficier de la quantité importante de données non étiquetées. Nous proposons des techniques pour améliorer l'algorithme de cotraining avec une sélection optimale des classifieurs utilisés.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Amélioration de la détection des concepts dans les vidéos en coupant de plus grandes tranches du monde visuel

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Amélioration de la détection des concepts dans les vidéos en coupant de plus grandes tranches du monde visuel

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses