Thèse soutenue

Analyse et modélisation des données à haute fréquence sur les marchés financiers en utilisant les processus de Hawkes et les réseaux de neurones

FR  |  
EN
Auteur / Autrice : Ruihua Ruan
Direction : Emmanuel BacryJean-François Muzy
Type : Thèse de doctorat
Discipline(s) : Mathématiques
Date : Soutenance le 04/12/2023
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : Ecole doctorale SDOSE (Paris)
Partenaire(s) de recherche : Laboratoire : Centre de recherche en mathématiques de la décision (Paris) - Centre de Recherche en Mathématiques de la Décision
établissement opérateur d'inscription : Université Paris Dauphine-PSL (1968-....)
Jury : Président / Présidente : Marc Hoffmann
Examinateurs / Examinatrices : Emmanuel Bacry, Jean-François Muzy, Marc Hoffmann, Samuel N. Cohen, Fabrizio Lillo, Sophie Laruelle, Stéphane Gaïffas, Ioane Susitino Patrick Muni Toke, Thomas Deschatre
Rapporteurs / Rapporteuses : Samuel N. Cohen, Fabrizio Lillo

Résumé

FR  |  
EN

Cette thèse est consacrée à l'étude de la microstructure du marché dans les marchés électroniques, en mettant l'accent sur deux sujets clés. Le premier sujet concerne la construction de deux modèles pour les événements de Niveau 1 dans le carnet d'ordres, en utilisant des approches basées sur des modèles statistiques. Le premier modèle consiste en un processus de Hawkes non-linéaire pour modéliser la dynamique du bid-ask spread, appelé le modèle "State-Dependent Spread Hawkes". En intégrant les tailles des sauts du spread et sa valeur dans la fonction d'intensité, ce modèle est capable de capturer diverses propriétés statistiques du spread. Le second modèle, appelé "Hawkes process with shot noise", est utilisé pour séparer les sources de corrélation endogènes et exogènes entre deux prix d'actifs. Pour ce faire, ce modèle suppose l'existence d'un processus latent (shot noise), représentant des comportements d'agents spécifiques non directement observables sur le marché. Théoriquement, des théorèmes de limite sont démontrés et dans la pratique, l'estimation est facilitée par une technique d'estimation non paramétrique. Le second sujet concerne l'analyse et la caractérisation des comportements des agents sur le marché financier, en utilisant des approches basées sur des réseaux neuronaux profonds. Ce sujet comprend deux tâches. La première tâche consiste à classifier les agents en fonction de leurs ordres passés, grâce à une approche d'apprentissage supervisé. La deuxième tâche vise à apprendre la représentation des comportements des agents, en utilisant un modèle d'apprentissage auto-supervisé fondé sur la triplet loss. Ces représentations apprises nous permettent d'appliquer l'algorithme de clustering K-means pour identifier des types de comportements distincts au sein de chaque groupe et ainsi analyser les comportements des agents.