Analyse statistique de l'évolution des sinistres graves pour une garantie risque corporel
Auteur / Autrice : | Isaac Cohen Sabban |
Direction : | Olivier Lopez |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques |
Date : | Soutenance le 01/07/2022 |
Etablissement(s) : | Sorbonne université |
Ecole(s) doctorale(s) : | École doctorale Sciences mathématiques de Paris centre (Paris ; 2000-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de probabilités, statistique et modélisation (Paris ; 2018-....) |
Jury : | Président / Présidente : Idris Kharroubi |
Examinateurs / Examinatrices : Yann Mercuzot | |
Rapporteurs / Rapporteuses : Bertrand Michel, Alexandre Brouste |
Résumé
L’objectif de cette thèse est de montrer comment la richesse des données disponibles sur des sinistres d’assurance peut être mise à profit pour améliorer significativement la prédiction du montant final d’un sinistre (ou son issue, lorsqu’on s’intéresse notamment à la classification d’un sinistre suivant son niveau de gravité). Pour traiter des données d’un tel volume - dont certaines sont des données textuelles, peu usuelles en assurance - nous utilisons des techniques d’apprentissage statistique (notamment réseaux de neurones profonds tels que les Convolutional Neural Networks ou des réseaux Long Short Term Memory) à la fois en tant que prédicteurs, mais aussi en tant qu’extracteurs d’information. L’étude des sinistres corporels nécessite un traitement spécifique du fait de leurs caractéristiques et de l’extrême volatilité de leur coût. L’utilisation d’outils issus de la Théorie des Valeurs Extrêmes nous a permis d’analyser la queue de distribution du montant des sinistres, mais aussi de déterminer un seuil de gravité. Une autre spécificité de notre approche a été de prendre en compte l’écoulement temporel des sinistres, particulièrement important lorsque l’on s’intéresse à une branche d’assurance à développement long comme la responsabilité civile. Au cours de cette thèse, nous avons été amenés à plusieurs reprises à utiliser les poids IPCW (Inverse-Probability-of-Censoring Weighting) afin de traiter le phénomène de censure qui rend l’information disponible incomplète.