Semi-supervised co-selection : instances and features : application to diagnosis of dry port by rail | Theses.fr

Raywat Makkhongkaew

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Co-selection instances-variables en mode semi-supervisé : application au diagnostic de transport ferroviaire.

FR |

EN

Auteur / Autrice :	Raywat Makkhongkaew
Direction :	Khalid Benabdeslem
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 15/12/2016
Etablissement(s) :	Lyon
Ecole(s) doctorale(s) :	École doctorale en Informatique et Mathématiques de Lyon (2009-....)
Partenaire(s) de recherche :	Laboratoire : Laboratoire d'InfoRmatique en Images et Systèmes d'information (Ecully, Rhône)
	établissement opérateur d'inscription : Université Claude Bernard (Lyon ; 1971-....)
Jury :	Président / Présidente : Yann Guermeur
	Examinateurs / Examinatrices : Hanene Azzag, Haytham Elghazel
	Rapporteurs / Rapporteuses : Pascale Kuntz-Cosperec, Mohamed Quafafou

Mots clés

FR |

EN

Mots clés contrôlés

Contraintes (intelligence artificielle)

Apprentissage supervisé (intelligence artificielle)

Rang et sélection (statistique)

Variables (mathématiques)

Mots clés libres

Sélection d'instances

Sélection de variables

Co-selection

Apprentissage semi-supervisé

Classification sous contraintes

Résumé

FR |

EN

Depuis la prolifération des bases de données partiellement étiquetées, l'apprentissage automatique a connu un développement important dans le mode semi-supervisé. Cette tendance est due à la difficulté de l'étiquetage des données d'une part et au coût induit de cet étiquetage quand il est possible, d'autre part.L'apprentissage semi-supervisé consiste en général à modéliser une fonction statistique à partir de base de données regroupant à la fois des exemples étiquetés et d'autres non-étiquetés. Pour aborder une telle problématique, deux familles d'approches existent : celles basées sur la propagation de la supervision en vue de la classification supervisée et celles basées sur les contraintes en vue du clustering (non-supervisé). Nous nous intéressons ici à la deuxième famille avec une difficulté particulière. Il s'agit d'apprendre à partir de données avec une partie étiquetée relativement très réduite par rapport à la partie non-étiquetée.Dans cette thèse, nous nous intéressons à l'optimisation des bases de données statistiques en vue de l'amélioration des modèles d'apprentissage. Cette optimisation peut être horizontale et/ou verticale. La première définit la sélection d'instances et la deuxième définit la tâche de la sélection de variables.Les deux taches sont habituellement étudiées de manière indépendante avec une série de travaux considérable dans la littérature. Nous proposons ici de les étudier dans un cadre simultané, ce qui définit la thématique de la co-sélection. Pour ce faire, nous proposons deux cadres unifiés considérant à la fois la partie étiquetée des données et leur partie non-étiquetée. Le premier cadre est basé sur un clustering pondéré sous contraintes et le deuxième sur la préservation de similarités entre les données. Les deux approches consistent à qualifier les instances et les variables pour en sélectionner les plus pertinentes de manière simultanée.Enfin, nous présentons une série d'études empiriques sur des données publiques connues de la littérature pour valider les approches proposées et les comparer avec d'autres approches connues dans la littérature. De plus, une validation expérimentale est fournie sur un problème réel, concernant le diagnostic de transport ferroviaire de l'état de la Thaïlande

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Co-selection instances-variables en mode semi-supervisé : application au diagnostic de transport ferroviaire.

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Co-selection instances-variables en mode semi-supervisé : application au diagnostic de transport ferroviaire.

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses