Methodes de discrimination : comparaison et correction des biais de preselection des echantillons

par CELINE GELPEROWIC

Thèse de doctorat en Sciences et techniques communes

Sous la direction de Jacqueline Pradel.

Soutenue en 2000

à Paris 9 .

    mots clés mots clés


  • Pas de résumé disponible.


  • Pas de résumé disponible.


  • Résumé

    Cette these porte sur la comparaison de trois methodes de discrimination, et plus particulierement sur les corrections a apporter a ces methodes quand les echantillons utilises ont ete preselectionnes. On s'interesse a trois methodes (l'analyse discriminante - lineaire ou quadratique-, la regression-logistique, probit- et le partitionnement recursif -ou segmentation par arbre binaire) dans le cas ou celles-ci sont employees pour faire de la prevision. On compare tout d'abord ces methodes (resume et complement). L'emploi des courbes de selection comme critere de comparaison, frequent pour les methodes parametriques, est etendu a la regle obtenue par partitionnement recursif. Ce critere trouve d'autres applications pour cette regle (reduction du grand arbre notamment). Lorsqu'elles sont construites a partir d'echantillons preselectionnes, les regles sont toutes moins performantes. On appelle biais de selection l'effet de la preselection de l'echantillon sur la regle de discrimination. Les methodes classiques de traitement des donnees manquantes sont inefficaces pour corriger ce biais. Pour la regle obtenue par analyse discriminante (lineaire), on propose une modelisation (modele bivarie fonde sur deux analyses discriminantes correlees) permettant de prendre en compte et de corriger le biais de selection. Pour ce modele, le biais apparait comme une erreur de specification ; de plus, la dualite qui existe entre la regression et l'analyse discriminante dans le cas d'echantillons complets se prolonge pour les modeles bivaries employes pour faire la correction. Pour la regle obtenue par partitionnement recursif, l'aspect non-parametrique rend plus difficile la prise en compte de la preselection. On propose alors une methode semi-parametrique, qui decoule de celle utilisee en regression, et qui permet de corriger le biais au niveau des nuds terminaux de l'arbre.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 157 p.
  • Annexes : 76 ref.

Où se trouve cette thèse ?

  • Bibliothèque : Université Paris-Dauphine (Paris). Service commun de la documentation.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.