Detection de ruptures dans des processus stochastiques et applications cybersécurité

par Fabrice Grela

Projet de thèse en Mathematiques appliquees et sciences sociales

Sous la direction de Magalie Fromont et de Ronan Le Guével.

Thèses en préparation à Rennes 2 , dans le cadre de Mathématiques et Sciences et Technologie de l'Information et de la Communication , en partenariat avec Institut de recherche mathématique (Rennes) (equipe de recherche) depuis le 18-09-2018 .


  • Résumé

    On considère un processus stochastique observé sur un intervalle de temps fini, dont la loi dépend d’une fonction constante par morceaux. Le nombre de discontinuités étant connu ou non, nous nous intéressons à l’estimation des instants de rupture et des valeurs prises par cette fonction. Cette question de la détection de ruptures dans la loi de processus stochastiques traduit des problèmes concrets dans des domaines variés (génomique, neurosciences, sciences de l’information, cybersécurité…). Selon la nature des données, les processus considérés pour les modéliser pourront être ponctuels comme les processus de Poisson, ou à trajectoires continues comme les mouvements browniens multifractionnaires. Cette question est abordée sous l’angle des tests multiples, en établissant un parallèle entre les intervalles de confiance pour les instants de rupture et les tests d’un continuum d’hypothèses. Plus précisément, on va chercher à tester si la distribution du processus reste inchangée sur chaque intervalle d'un recouvrement de l'intervalle sur lequel est observé le processus. L’étude théorique de tels tests multiples d’un continuum d’hypothèses est très peu abordée dans la littérature, et le cadre des tests multiples classiques (i.e. d’un nombre fini d’hypothèses), pour lesquels de nombreux critères liés à l’erreur de première espèce (comme la Family Wise Error Rate (FWER) ou la False Discovery Rate (FDR)) et des critères d’optimalité liés à l’erreur de deuxième espèce (comme la minimax Family Wise Separation Rate), est à adapter. Un deuxième objectif sera alors de construire des procédures de tests multiples optimales pour la détection de ruptures en temps réel (apprentissage statistique). Enfin, le troisième objectif sera d’appliquer ces procédures à des données réelles et de mesurer leur performance dans la pratique en les confrontant aux procédures existantes, en collaborations avec la DGA Maîtrise de l’Information.


  • Pas de résumé disponible.