Thèse soutenue

Prédiction d'alarmes dans les réseaux via la recherche de motifs spatio-temporels et l'apprentissage automatique

FR  |  
EN
Auteur / Autrice : Achille Salaün
Direction : François DesbouvriesAnne Bouillard
Type : Thèse de doctorat
Discipline(s) : Mathématiques aux interfaces
Date : Soutenance le 08/07/2021
Etablissement(s) : Institut polytechnique de Paris
Ecole(s) doctorale(s) : École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Télécom SudParis (France) - Institut Polytechnique de Paris / IP Paris - Communications, Images et Traitement de l'Information / CITI - Traitement de l'Information Pour Images et Communications / TIPIC-SAMOVAR
Etablissement opérateur d'inscription : Télécom SudParis (France)
Jury : Président / Présidente : Erwan Le Pennec
Examinateurs / Examinatrices : Anne Bouillard, Maurizio Filippone, Matthieu Latapy, Johanne Cohen
Rapporteurs / Rapporteuses : Maurizio Filippone, Matthieu Latapy

Résumé

FR  |  
EN

Les réseaux de télécommunication prennent aujourd'hui une place prépondérante dans notre monde. Ils permettent en effet de partager des informations en masse et à l’échelle planétaire. Toutefois, il s’agit de systèmes complexes, en taille comme en diversité technologique. Cela rend d’autant plus complexes leur maintenance et leur réparation. Afin de limiter l’influence négative de ces dernières, des outils doivent être développés pour détecter une panne dès qu’elle a lieu, en analyser les causes afin de la résoudre efficacement, voire prédire ladite panne pour prévenir plutôt que guérir. Dans cette thèse, nous nous intéressons principalement à ces deux derniers problèmes. Pour cela, nous disposons de fichiers, appelés logs d’alarmes, recensant l’ensemble des alarmes émises par le système. Cependant, ces fichiers sont généralement verbeux et bruités: l’administrateur à la charge d’un réseau doit disposer d’outils capables d’isoler et manipuler de façon interprétable les liens de causalité au sein d’un log. Dans cette thèse, nous avons suivi deux approches. La première est inspirée des techniques de correspondance de motifs: en s’inspirant de l’algorithme d’Ukkonen, nous construisons en ligne une structure, appelée DIG-DAG, qui stocke toutes les chaînes de causalité possibles entre les événements d’un log. Nous proposons également un système de requête pour exploiter cette structure. Enfin, nous appliquons cette approche dans le cadre de l’analyse de causes racines. La seconde approche est une approche générative pour la prédiction de données. En particulier, nous comparons deux modèles classiques pour cette tâche: les réseaux de neurones récurrents d’une part et les modèles de Markov cachés d’autre part. En effet, dans leurs communautés respectives, ces deux modèles font office d’état de l’art. Ici, nous comparons analytiquement leurs expressivités grâce à un modèle probabiliste, appelé GUM, englobant ces deux modèles.