Three essays on the informational efficiency of financial markets through the use of Big Data Analytics

par Thomas Renault

Thèse de doctorat en Sciences de gestion

Sous la direction de Roland Gillet.

Le jury était composé de Roland Gillet, Jean-Paul Laurent, Peter Pope.

Les rapporteurs étaient Jean-François Gajewski, Alain C. J. Durré.

  • Titre traduit

    Trois essais sur l'efficience informationnelle des marchés financiers : une approche big data


  • Résumé

    L’augmentation massive du volume de données générées chaque jour par les individus sur Internet offre aux chercheurs la possibilité d’aborder la question de la prédictibilité des marchés financiers sous un nouvel angle. Sans prétendre apporter une réponse définitive au débat entre les partisans de l’efficience des marchés et les chercheurs en finance comportementale, cette thèse vise à améliorer notre compréhension du processus de formation des prix sur les marchés financiers grâce à une approche Big Data. Plus précisément, cette thèse porte sur (1) la mesure du sentiment des investisseurs à fréquence intra-journalière, et le lien entre le sentiment des investisseurs et les rendements agrégés du marché,(2) la mesure de l’attention des investisseurs aux informations économiques et financières en temps réel, et la relation entre l’attention des investisseurs et la dynamique des prix des actions des sociétés à forte capitalisation, et enfin, (3) la détection des comportements suspicieux pouvant amoindrir le rôle informationnel des marchés financiers, et le lien entre le volume d’activité sur les réseaux sociaux et le prix des actions des entreprises de petite capitalisation. Le premier essai propose une méthodologie permettant de construire un nouvel indicateur du sentiment des investisseurs en analysant le contenu des messages publiés sur le réseau social Stock-Twits. En examinant les caractéristiques propres à chaque utilisateur (niveau d’expérience, approche d’investissement, période de détention), cet essai fournit des preuves empiriques montrant que le comportement des investisseurs naïfs, sujets à des périodes d’excès d’optimisme ou de pessimisme, a un impact sur la valorisation du marché action, et ce en accord avec les théories de la finance comportementale. Le deuxième essai propose une méthodologie permettant de mesurer l’attention des investisseurs aux informations en temps réel, en combinant les données des médias traditionnels avec le contenu des messages envoyés par une liste d’experts sur la plateforme Twitter. Cet essai démontre que lorsqu’une information attire l’attention des investisseurs, les mouvements de marchés sont caractérisés par une forte hausse des volumes échangés, une hausse de la volatilité et des sauts de prix. Cet essai démontre également qu’il n’y a pas de fuite d’information significative lorsque les sources d’informations sont combinées pour corriger un potentiel problème d’horodatage. Le troisième essai étudie le risque de manipulation informationnelle en examinant un nouveau jeu de données de messages publiés sur Twitter à propos des entreprises de petite capitalisation. Cet essai propose une nouvelle méthodologie permettant d’identifier les comportements anormaux de manière automatisée en analysant les interactions entre les utilisateurs. Étant donné le grand nombre de recommandations suspicieuses d’achat envoyées par certains groupes d’utilisateurs, l’analyse empirique et les conclusions de cet essai soulignent la nécessité d’un plus grand contrôle par les régulateurs de l’information publiée sur les réseaux sociaux ainsi que l’utilité d’une meilleure éducation des investisseurs individuels.


  • Résumé

    The massive increase in the availability of data generated everyday by individuals on the Internet has made it possible to address the predictability of financial markets from a different perspective. Without making the claim of offering a definitive answer to a debate that has persisted for forty years between partisans of the efficient market hypothesis and behavioral finance academics, this dissertation aims to improve our understanding of the price formation process in financial markets through the use of Big Data analytics. More precisely, it analyzes: (1) how to measure intraday investor sentiment and determine the relation between investor sentiment and aggregate market returns, (2) how to measure investor attention to news in real time, and identify the relation between investor attention and the price dynamics of large capitalization stocks, and (3) how to detect suspicious behaviors that could undermine the in-formational role of financial markets, and determine the relation between the level of posting activity on social media and small-capitalization stock returns. The first essay proposes a methodology to construct a novel indicator of investor sentiment by analyzing an extensive dataset of user-generated content published on the social media platform Stock-Twits. Examining users’ self-reported trading characteristics, the essay provides empirical evidence of sentiment-driven noise trading at the intraday level, consistent with behavioral finance theories. The second essay proposes a methodology to measure investor attention to news in real-time by combining data from traditional newswires with the content published by experts on the social media platform Twitter. The essay demonstrates that news that garners high attention leads to large and persistent change in trading activity, volatility, and price jumps. It also demonstrates that the pre-announcement effect is reduced when corrected newswire timestamps are considered. The third essay provides new insights into the empirical literature on small capitalization stocks market manipulation by examining a novel dataset of messages published on the social media plat-form Twitter. The essay proposes a novel methodology to identify suspicious behaviors by analyzing interactions between users and provide empirical evidence of suspicious stock recommendations on social media that could be related to market manipulation. The conclusion of the essay should rein-force regulators’ efforts to better control social media and highlights the need for a better education of individual investors.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Bibliothèque Cujas de droit et de sciences économiques (Paris).
  • Bibliothèque : Bibliothèque électronique de l'université Paris 1 Panthéon-Sorbonne.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.