Approches théoriques de l'estimation de niveaux de densité : application à la détection d'anomalies

par Régis Vert

Thèse de doctorat en Informatique

Sous la direction de Stéphane Boucheron.

Soutenue en 2006

à Paris 11 , en partenariat avec Université de Paris-Sud. Faculté des Sciences d'Orsay (Essonne) (autre partenaire) .

    mots clés mots clés


  • Résumé

    Les ensembles de niveaux de densité (e. N. D. ) sont des objets particulièrement intéressants dans le contexte général de l'analyse discriminante : ils correspondent aux régions optimales servant à discriminer une classe des autres. Cette thèse, qui s'inscrit dans le cadre de la théorie de l'apprentissage statistique, s'intéresse aux différentes procédures pour estimer les e. N. D. A partir de données échantillonnées. Elle se compose essentiellement de 4 contributions : les deux premières contributions fournissent des analyses théoriques du comportement statistique associe, d'une part, aux méthodes de type plug-in, et, d'autre part, à la 1-class Support Vector Machine (SVM). Elles donnent des résultats de consistance pour ces méthodes, ainsi que des bornes de risque. La troisième contribution introduit un nouvel algorithme, la Kernel Projection Machine (KPM), pour la classification. Elle montre également comment il est possible d'utiliser un tel algorithme pour l'estimation d'e. N. D. , et comment dériver des bornes de risques associées. Enfin, la dernière contribution présente une application de l'estimation d'e. N. D. A un problème industriel, lie au contrôle de qualité dans le domaine de la fabrication des semi-conducteurs.

  • Titre traduit

    Theoretical insights on density level set estimation : application to anomaly detection


  • Résumé

    Density level sets (d. L. S. ) are objects of particular interest in the general context of discriminant analysis: they are used to define optimal tests to discriminate one class from the others. The present thesis work, which belongs to the statistical learning theory framework, investigates different procedures to estimate d. L. S. From a data sample. It mainly consists of 4 contributions: the first two ones provide a theoretical analysis of the statistical behaviour of plug-in methods on the one hand, and of 1-class Support Vector Machine (SVM) on the other hand. They give consistency results and performance bounds associated with these methods. The third contribution introduces a new algorithm for pattern recognition, namely the Kernel Projection Machine (KPM), and it shows how to turn such an algorithm into a procedure for d. L. S. Estimation. It also shows how to derive associated performance bounds. Finally, a real-world application of d. L. S. Estimation is presented. It is concerned with monitoring testers involved in quality control procedures in the semiconductors industry.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol., 144 p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 133-138

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : 0g ORSAY(2006)95
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.