Thèse soutenue

Data analysis for insurance : recommendation system based on a Multivariate Hawkes Process

FR  |  
EN
Auteur / Autrice : Laurent Lesage
Direction : Madalina DeaconuRadu State
Type : Thèse de doctorat
Discipline(s) : Mathématiques
Date : Soutenance le 26/04/2022
Etablissement(s) : Université de Lorraine en cotutelle avec Université du Luxembourg
Ecole(s) doctorale(s) : École doctorale IAEM Lorraine - Informatique, Automatique, Électronique - Électrotechnique, Mathématiques de Lorraine
Partenaire(s) de recherche : Laboratoire : Institut Élie Cartan de Lorraine (1997-.... ; Vandoeuvre-lès-Nancy, Metz)
Jury : Président / Présidente : Ulrich Sorger
Examinateurs / Examinatrices : Madalina Deaconu, Radu State, Caroline Hillairet, Anthony Réveillac, Antoine Lejay
Rapporteurs / Rapporteuses : Caroline Hillairet, Anthony Réveillac

Résumé

FR  |  
EN

L'objectif de la thèse est de construire un système de recommandation pour l'assurance. En observant le comportement et l'évolution d'un client dans le contexte assurantiel, les clients semblent modifier leur couverture d'assurance lorsqu'un événement important survient dans leur vie. Afin de prendre en compte l'influence des événements de la vie (par exemple, mariage, naissance, changement d'emploi) sur la sélection des garanties d'assurance auprès des clients, nous modélisons le système de recommandation avec un processus de Hawkes multivarié, qui comprend plusieurs fonctionnalités spécifiques visant à calculer des recommandations pertinentes. aux clients d'une compagnie d'assurance luxembourgeoise. Plusieurs de ces fonctionnalités visent à proposer une "background intensity" personnalisée pour chaque client grâce à un modèle de Machine Learning, à utiliser des fonctions de déclenchement adaptées aux données d'assurance ou à pallier les failles des données du monde réel en ajoutant un terme de pénalisation spécifique dans la fonction objectif. Nous définissons un cadre complet de processus de Hawkes multivariés avec une fonction d'excitation de densité gamma (estimation, simulation, qualité de l'ajustement) et nous démontrons certaines propriétés mathématiques (espérance, variance) sur le régime transitoire du processus. Notre système de recommandation a été back-testé sur une année complète. Les observations des paramètres du modèle et les résultats de ce back-test montrent que la prise en compte des événements de la vie par un Processus de Hawkes Multivarié permet d'améliorer significativement la précision des recommandations. La thèse est présentée en 4 chapitres. Le chapitre 1 explique comment la "background intensity" du processus de Hawkes multivarié est calculée grâce à un algorithme de Machine Learning, afin que chaque client ait une recommandation personnalisée. Le chapitre 1 présente une version étendue de la méthode présentée dans "Un système de recommandation pour l'assurance automobile", dans laquelle la méthode est utilisée pour rendre l'algorithme explicable. Le chapitre 2 présente un cadre de processus de Hawkes multivariés afin de calculer la dépendance entre la propension à accepter une recommandation et l'occurrence d'événements de vie : définitions, notations, simulation, estimation, propriétés, etc. Le chapitre 3 présente plusieurs résultats du système de recommandation : paramètres estimés du modèle, effets des contributions, back-testing de la précision du modèle, etc. Le chapitre 4 présente l'implémentation de nos travaux dans un package R.