Machine Learning Strategies for Large-scale Taxonomies | Theses.fr

Rohit Babbar

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Strategies d'apprentissage pour la classification dans les grandes taxonomies

FR |

EN

Auteur / Autrice :	Rohit Babbar
Direction :	Éric Gaussier, Massih-Reza Amini
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 17/10/2014
Etablissement(s) :	Grenoble
Ecole(s) doctorale(s) :	École doctorale mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 199.-....)
Partenaire(s) de recherche :	Laboratoire : Laboratoire d'informatique de Grenoble
Jury :	Président / Présidente : Denis Trystram
	Examinateurs / Examinatrices : Éric Gaussier, Massih-Reza Amini, Bernhard Schölkopf, Thierry Artières
	Rapporteurs / Rapporteuses : Yiming Yang, Yann Guermeur

Mots clés

FR |

EN

Mots clés contrôlés

Apprentissage automatique

Mots clés libres

Apprentissage automatique

Classification à large échelle

Classification hiérarchique

Résumé

FR |

EN

À l'ère de Big Data, le développement de modèles d'apprentissage machine efficaces et évolutifs opérant sur des Tera-Octets de données est une nécessité. Dans cette thèse, nous étudions un cadre d'apprentissage machine pour la classification hiérarchique à large échelle. Cette analyse comprend l'étude des défis comme la complexité d'entraînement des modèles ainsi que leur temps de prédiction. Dans la première partie de la thèse, nous étudions la distribution des lois de puissance sous-jacente à la création des taxonomies à grande échelle. Cette étude permet de dériver des bornes sur la complexité spatiale des classifieurs hiérarchiques. L'exploitation de ce résultat permet alors le développement des modèles efficaces pour les classes distribuées selon une loi de puissance. Nous proposons également une méthode efficace pour la sélection de modèles pour des classifieurs multi-classes de type séparateurs à vaste marge ou de la régression logistique. Dans une deuxième partie, nous étudions le problème de la classification hiérarichique contre la classification plate d'un point de vue théorique. Nous dérivons une borne sur l'erreur de généralisation qui permet de définir les cas où la classification hiérarchique serait plus avantageux que la classification plate. Nous exploitons en outre les bornes développées pour proposer deux méthodes permettant adapter une taxonomie donnée de catégories à une taxonomies de sorties qui permet d'atteindre une meilleure performance de test.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Strategies d'apprentissage pour la classification dans les grandes taxonomies

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Strategies d'apprentissage pour la classification dans les grandes taxonomies

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses