Auteur / Autrice : | Asma Guizani |
Direction : | Gilbert Saporta, Gilbert Laffond, Salwa Benammou |
Type : | Thèse de doctorat |
Discipline(s) : | Théorie des systèmes économiques |
Date : | Soutenance le 19/03/2014 |
Etablissement(s) : | Paris, CNAM en cotutelle avec Institut Supérieur de Gestion de Sousse |
Ecole(s) doctorale(s) : | École doctorale Abbé Grégoire (Paris) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire interdisciplinaire de recherche en sciences de l'action (Paris) - Computational Mathematics Laboratory (Monastir) |
Jury : | Président / Présidente : Pierre Cazes |
Examinateurs / Examinatrices : Meglena Jeleva | |
Rapporteurs / Rapporteuses : Taher Hamza, Cristian Preda |
Mots clés
Mots clés contrôlés
Résumé
Le credit scoring est généralement considéré comme une méthode d’évaluation du niveau du risque associé à un dossier de crédit potentiel. Cette méthode implique l'utilisation de différentes techniques statistiques pour aboutir à un modèle de scoring basé sur les caractéristiques du client.Le modèle de scoring estime le risque de crédit en prévoyant la solvabilité du demandeur de crédit. Les institutions financières utilisent ce modèle pour estimer la probabilité de défaut qui va être utilisée pour affecter chaque client à la catégorie qui lui correspond le mieux: bon payeur ou mauvais payeur. Les seules données disponibles pour construire le modèle de scoring sont les dossiers acceptés dont la variable à prédire est connue. Ce modèle ne tient pas compte des demandeurs de crédit rejetés dès le départ ce qui implique qu'on ne pourra pas estimer leurs probabilités de défaut, ce qui engendre un biais de sélection causé par la non-représentativité de l'échantillon. Nous essayons dans ce travail en utilisant l'inférence des refusés de remédier à ce biais, par la réintégration des dossiers refusés dans le processus d'octroi de crédit. Nous utilisons et comparons différentes méthodes de traitement des refusés classiques et semi supervisées, nous adaptons certaines à notre problème et montrons sur un jeu de données réel, en utilisant les courbes ROC confirmé par simulation, que les méthodes semi-supervisé donnent de bons résultats qui sont meilleurs que ceux des méthodes classiques.