Techniques de lissage et de régularisation en analyse discriminante

par CONCHITA CALLANT CRANSVELD

Thèse de doctorat en Sciences et techniques communes

Sous la direction de Edwin Diday.

Soutenue en 1991

à Paris 9 .

    mots clés mots clés


  • Résumé

    Dans cette étude nous avons abordé les techniques de régularisation et de lissage appliquées à la construction et à la validation de modèles de discrimination. Pour chaque partie, nous présentons des études numériques sur des données générées de façon aléatoire. Dans la partie I, nous abordons le modèle d'analyse discriminante régularisée proposé par Friedman (1989). Ce modèle permet de traiter les problèmes pauvrement-posés ou mal-posés sans sélectionner les variables et utilise deux paramètres de régularisation qui modifient les matrices de variance-covariance. Nous proposons une méthode d'estimation des valeurs de ces paramètres par une méthode de type quasi-Newton. Nous minimisons directement le critère du taux d'erreur par validation croisée. Au contraire de Friedman, nous optons pour le plus petit degré de régularisation pour les deux paramètres lorsque les paramètres fournissent des taux d'erreur égaux par validation croisée. Cette stratégie peut produire des valeurs très différentes pour les paramètres et peut être préférée dans certains cas (taille d'échantillon pas trop petite ou bon pouvoir discriminant potentiel de la discrimination quadratique). Dans la partie II , nous présentons un aperçu des différentes méthodes de ré-échantillonnage et leur régularisation. Bien que les méthodes de ré-échantillonnage soient des méthodes non paramétriques, elles sont fortement sensibles aux points atypiques. Nous proposons une nouvelle méthode de validation croisée dite validation croisée régularisée (VCR). Elle utilise deux paramètres de régularisation: le premier pour réduire l'influence d'un point atypique contenu dans l'échantillon d'apprentissage, le deuxième pour réduire l'influence d'un point atypique contenu dans l'échantillon test. Son originalité et son intérêt résident dans la régularisation du critère de validation croisée à partir de la distribution de groupe. La VCR fournit des règles de décision plus robustes. Elle permet de traiter les échantillons contenant des points atypiques sans les supprimer. Les études numériques montrent la fiabilité et la validité des nouvelles techniques proposées


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Annexes : 68 réf

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Dauphine (Paris). Service commun de la documentation.
  • Disponible pour le PEB
  • Bibliothèque : Université Pierre et Marie Curie. Bibliothèque Universitaire Pierre et Marie Curie . Section Mathématiques-Informatique Recherche.
  • Accessible pour le PEB
  • Cote : THESE 01117
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.