Modélisation du Carnet d'Ordres : Des Méthodes Statistiques aux Techniques d'Apprentissage Automatique
Auteur / Autrice : | Salma Elomari |
Direction : | Michael Benzaquen, Jean-Philippe Bouchaud |
Type : | Thèse de doctorat |
Discipline(s) : | Physique |
Date : | Soutenance le 09/12/2024 |
Etablissement(s) : | Institut polytechnique de Paris |
Ecole(s) doctorale(s) : | École doctorale de l'Institut polytechnique de Paris |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'Hydrodynamique de l'École polytechnique (Palaiseau ; 1990-....) - Laboratoire d'hydrodynamique / LadHyX |
Jury : | Président / Présidente : Jean-Paul Laurent |
Examinateurs / Examinatrices : Michael Benzaquen, Jean-Philippe Bouchaud, Fabrizio Lillo, Stefan Zohren, Ioane Susitino Patrick Muni Toke, Anastasia Borovykh | |
Rapporteurs / Rapporteuses : Fabrizio Lillo, Stefan Zohren |
Mots clés
Mots clés contrôlés
Résumé
Sur les marchés financiers actuels, qui évoluent rapidement, il est essentiel pour les investisseurs, les régulateurs et les chercheurs de comprendre les subtilités des mécanismes de palcement d'ordres et la dynamique des prix. Le carnet d'ordres est un outil central dans ces marchés électroniques modernes, car il capture les interactions entre les acheteurs et les vendeurs. Cette thèse se concentre sur la compréhension de la micro-dynamique des prix et du flux d'ordres dans les LOB, avec l'objectif principal d'améliorer la prédiction et la compréhension des séries temporelles financières.L'étude commence par l'établissement d'un cadre pour définir les changements de prix significatifs et proposer une échelle de temps optimale pour capturer les informations significatives. Pour ce faire, nous utilisons l'analyse en composantes principales pour identifier et établir les « modes de microstructure », qui représentent les modes de flux et de rendement les plus courants sur le marché. Grâce à ces modes définis, nous développons un modèle vectoriel autorégressif (VAR) visant à prédire le prochain changement de prix au sein du marché. La calibration de ce modèle démontre un pouvoir prédictif substantiel, contribuant ainsi à la conversation en cours concernant le potentiel de « crises de liquidité endogènes » qui peuvent émerger de l'interaction de différentes dynamiques de marché.En nous appuyant sur ce cadre analytique, nous explorons ensuite les mécanismes d'auto-attention dérivés du machine learning pour modéliser le même phénomène. Cette approche moderne nous permet d'évaluer l'efficacité d'un modèle hautement paramétré dans la compréhension des dynamiques de marché.Cette thèse se concentre également sur la simulation de séries temporelles du carnet d'ordres à l'aide de réseaux neuronaux récurrents (RNN), qui sont bien adaptés à la modélisation de données séquentielles. Dans un premier temps, nous abordons l'échelle temporelle transaction par transaction, où nous modélisons l'évolution des trois premiers niveaux de la LOB, en optimisant la précision de la dynamique des pas de temps. Cette architechture détaillée nous permet d'évaluer la capacité de notre modèle à reproduire les effets stylisés stables observés sur les marchés financiers sur de longues périodes. Par la suite, nous étendons notre étude pour simuler l'ensemble du carnet d'ordre au niveau du tick-by-tick, ce qui nous permet de mieux comprendre le comportement et les interactions du marché.Finalement, cette approche à multiples facettes vise à améliorer considérablement notre compréhension de la microstructure des marchés tout en améliorant les capacités prédictives et génératives des modèles LOB.