Méthodes de discrimination : comparaison et correction des biais de présélection des échantillons

par Céline Gelperowic

Thèse de doctorat en Sciences : mathématiques appliquées

Sous la direction de Jacqueline Pradel.

Soutenue en 2000

à l'Université Paris-Dauphine .

    mots clés mots clés


  • Résumé

    Cette thèse porte sur la comparaison de trois méthodes de discrimination, et plus particulierement sur les corrections à apporter à ces méthodes quand les échantillons utilisés ont été présélectionnés. On s'intéresse à trois méthodes (l'analyse discriminante - linéaire ou quadratique-, la régression-logistique, probit- et le partitionnement récursif -ou segmentation par arbre binaire) dans le cas où celles-ci sont employées pour faire de la prévision. On compare tout d'abord ces méthodes (résumé et complément). L'emploi des courbes de sélection comme critère de comparaison, fréquent pour les méthodes paramétriques, est étendu à la règle obtenue par partitionnement récursif. Ce critère trouve d'autres applications pour cette règle (réduction du grand arbre notamment). Lorsqu'elles sont construites à partir d'échantillons présélectionnés, les règles sont toutes moins performantes. On appelle biais de sélection l'effet de la présélection de l'échantillon sur la règle de discrimination. Les méthodes classiques de traitement des données manquantes sont inefficaces pour corriger ce biais. Pour la règle obtenue par analyse discriminante (linéaire), on propose une modélisation (modèle bivarié fondé sur deux analyses discriminantes corrélées) permettant de prendre en compte et de corriger le biais de sélection. Pour ce modèle, le biais apparait comme une erreur de spécification ; de plus, la dualité qui existe entre la régression et l'analyse discriminante dans le cas d'échantillons complets se prolonge pour les modèles bivariés employés pour faire la correction. Pour la règle obtenue par partitionnement récursif, l'aspect non-paramétrique rend plus difficile la prise en compte de la présélection. On propose alors une méthode semi-paramétrique, qui découle de celle utilisée en régression, et qui permet de corriger le biais au niveau des noeuds terminaux de l'arbre.


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 157 p.
  • Annexes : 76 réf.

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Dauphine (Paris). Service commun de la documentation.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.