Distance metric learning for image and webpage comparison | Theses.fr

Marc Teva Law

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Apprentissage de distance pour la comparaison d'images et de pages Web

FR |

EN

Auteur / Autrice :	Marc Teva Law
Direction :	Matthieu Cord, Stéphane Gançarski
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 20/01/2015
Etablissement(s) :	Paris 6
Ecole(s) doctorale(s) :	École doctorale Informatique, télécommunications et électronique de Paris
Partenaire(s) de recherche :	Laboratoire : LIP6 (1997-....)
Jury :	Examinateurs / Examinatrices : Francis Bach, Patrick Gallinari, Jean Ponce, Frédéric Precioso
	Rapporteurs / Rapporteuses : Patrick Pérez, Alain Rakotomamonjy

Mots clés

FR |

EN

Mots clés contrôlés

Web

Traitement d'images -- Techniques numériques

Mots clés libres

Apprentissage de métrique

Reconnaissance d'image

Vision par ordinateur

Régularisation

Fantope

Distance

Résumé

FR |

EN

Cette thèse se focalise sur l'apprentissage de distance pour la comparaison d'images ou de pages Web. Les distances (ou métriques) sont exploitées dans divers contextes de l'apprentissage automatique et de la vision artificielle tels que la recherche des k plus proches voisins, le partitionnement, les machines à vecteurs de support, la recherche d'information/images, la visualisation etc. Nous nous intéressons dans cette thèse à l'apprentissage de fonction de distance paramétrée par une matrice symétrique semi-définie positive. Ce modèle, appelé (par abus) apprentissage de distance de Mahalanobis, consiste à apprendre une transformation linéaire des données telle que la distance euclidienne dans l'espace projeté appris satisfasse les contraintes d'apprentissage.Premièrement, nous proposons une méthode basée sur la comparaison de distances relatives qui prend en compte des relations riches entre les données, et exploite des similarités entre quadruplets d'exemples. Nous appliquons cette méthode aux attributs relatifs et à la classification hiérarchique d'images.Deuxièmement, nous proposons une nouvelle méthode de régularisation qui permet de contrôler le rang de la matrice apprise, limitant ainsi le nombre de paramètres indépendants appris et le sur-apprentissage. Nous montrons l'intérêt de notre méthode sur des bases synthétiques et réelles d'identification de visage.Enfin, nous proposons une nouvelle méthode de détection automatique de changement dans les pages Web, dans un contexte d'archivage. Pour cela, nous utilisons les relations de distance temporelle entre différentes versions d'une même page Web. La métrique apprise de façon entièrement non supervisée détecte les régions d'intérêt de la page et ignore le contenu non informatif tel que les menus et publicités. Nous montrons l'intérêt de la méthode sur différents sites Web.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Apprentissage de distance pour la comparaison d'images et de pages Web

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Apprentissage de distance pour la comparaison d'images et de pages Web

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses