Etude du couplage vent solaire / magnétosphère par des méthodes de «machine-learning»

par Gautier Nguyen

Projet de thèse en Physique

Sous la direction de Dominique Fontaine et de Nicolas Aunai.

Thèses en préparation à Paris Saclay , dans le cadre de École doctorale Astronomie et astrophysique d'Île-de-France (Meudon, Hauts-de-Seine ; 1992-....) , en partenariat avec Laboratoire de Physique des Plasmas (Palaiseau) (laboratoire) et de Université Paris-Sud (1970-2019) (établissement de préparation de la thèse) depuis le 02-10-2017 .


  • Résumé

    Le Soleil est une étoile active qui émet en permanence un flux de particules appelé vent solaire et qui se propage à des vitesses supersoniques dans le système solaire. L'interaction du vent solaire avec une planète produit deux frontières qui contrôlent la conversion d'énergie dans les interactions vent solaire / magnétosphère. En amont de la planète, le choc d'étrave contribue à décélérer et à dévier le vent solaire autour de l'obstacle planétaire. En aval, la magnétopause est la frontière de la magnétosphère, grande cavité contenant l'environnement planétaire. A priori impénétrable à grande échelle, cette frontière est le siège de processus physiques de petite échelle très importants qui permettent l'échange de masse et d'énergie entre les milieux planétaire et interplanétaire. La région comprise entre le choc et la magnétopause, appelée 'magnétogaine', est caractérisée par du vent solaire turbulent, comprimé et chauffé. Les propriétés de cette région sont cruciales pour comprendre le déclenchement et la dynamique des processus à la magnétopause, et donc les couplages vent solaire / magnétosphère. Les propriétés et la dynamique de la magnétogaine ne sont pas encore bien comprises. Les magnétosphères des autres planètes que la Terre sont rarement explorées par les sondes planétaires principalement centrées sur l'observation des environnements planétaires pour eux-mêmes. Dans le cas de la planète Terre, plusieurs missions traversent la magnétogaine terrestre et des mesures in situ ont révélé des cas d'étude intéressants. Seules quelques études statistiques existent, elles exploitent des données sur les 4-5 ans des missions Cluster ou THEMIS, mais utilisent généralement des modèles analytiques pour déterminer la position des frontières et fournissent la distribution des paramètres plasmas mais en général à 2D, intégrés dans la 3ème dimension. La réalisation d'études statistiques à grande échelle est désormais possible sur de plus longues périodes grâce à l'accumulation de données issues de missions principales telles que Cluster (> 2000), THEMIS (> 2007) et MMS (> 2015). Cependant, l'identification des régions clés dans une grande masse de données constitue aujourd'hui un goulot d'étranglement majeur pour ce type d'analyse. Les méthodes d'apprentissage statistique (machine learning) représentent une approche très prometteuse. Après une phase d'apprentissage, les algorithmes peuvent apprendre à détecter les traversées de choc, de gaine et de magnétopause, automatisant ainsi la collecte de données. D'autre part, les méthodes d'apprentissage peuvent également présenter un grand intérêt pour modéliser les propriétés de ces régions en fonction des propriétés du vent solaire. Une telle méthodologie, bien que largement utilisée dans l'industrie, est encore très nouvelle en physique spatiale. Avec l'aide d'experts locaux, le doctorant mettra en œuvre et testera les algorithmes d'apprentissage automatique pour automatiser la sélection de régions clés dans les données spatiales. Cette phase nécessitera de parcourir et étiqueter les données, puis d'entraîner les algorithmes et d'évaluer leur performance. En utilisant les régions détectées, l'objectif principal sera d'abord de construire un modèle 3D de la magnétogaine en fonction des paramètres clés du vent solaire, observé en continu en amont de l'environnement terrestre (missions ACE et WIND). Ce modèle comprendra: - la distribution 3D des densités de plasma, des vitesses, de l'amplitude et de l'orientation des champs magnétiques à l'intérieur de la gaine - la localisation 3D des frontières de la gaine (choc et magnétopause) en fonction des propriétés du vent solaire. La deuxième partie de la thèse se concentrera sur la reconnexion magnétique se produisant à la magnétopause. En utilisant l'apprentissage automatique pour détecter automatiquement des signatures de reconnexion telles que les jets de plasma, l'étudiant construira une représentation des flux de particules accélérées à la surface de la magnétopause, ce qui représente un paramètre clé pour comprendre quand, où et comment la reconnexion se produit en fonction du vent solaire et des propriétés de la gaine. Cette question ancienne, à la fois fondamentale et pragmatique, n'a été abordée que par des approches statistiques à ce jour. L'exploitation de ces méthodes d'apprentissage statistique devrait améliorer considérablement la capacité de notre communauté à caractériser l'environnement spatial de la Terre et faire progresser notre compréhension sur les aspects globaux des interactions entre le vent solaire et les magnétosphères terrestre et planétaires.

  • Titre traduit

    Solar wind / magnetosphere coupling inferred from machine-learning methods


  • Résumé

    The Sun is an active star that permanently emits a flow of particles called solar wind that propagates at supersonic speeds in the solar system. The interaction of the solar wind with a planet results in two boundaries which govern the energy conversion in the solar wind / magnetosphere interactions. Upstream of the planet, the bow shock contributes to decelerate and deflect the solar wind around the planetary obstacle. Downstream of it, the magnetopause is the boundary of the magnetosphere, large cavity containing the planetary environment. A priori impenetrable at large scale, this boundary is the location of very important small-scale physical processes that allow mass and energy exchanges between the planetary and interplanetary media. The region in between the shock and the magnetopause, called “magnetosheath”, is made of compressed, heated and turbulent solar wind. The properties of this region are crucial to understand the triggering and dynamics of magnetopause processes, and thus the solar wind / magnetosphere couplings. The properties and dynamics of the magnetosheath are yet not very well understood. The magnetosheath of other planets than Earth are only rarely explored by planetary missions primarily focusing on the planet's environments themselves. For Earth, several missions cross the terrestrial manetosheath and in situ measurements have revealed interesting study cases. Only few statistical studies exist, they gather data over 4-5 years of the Cluster ou THEMIS missions, but they generally use analytical model to determine the location of the boundaries and provide the distribution of plasma parameters but generally at 2D and integrated in the 3rd dimension. Performing large scale statistical studies is now becoming possible over longer time periods thanks to the accumulation of data from main missions such as Cluster (>2000), THEMIS (>2007) and MMS (>2015). However, identifying the key regions in a massive amount of data constitutes today a major bottleneck to this kind of analysis. Machine learning methods represent a very promising approach. After a learning phase, algorithms can learn to detect shock, sheath and magnetopause crossings, thereby automating the data collection. Then, learning methods can also be of great interest to model the properties of these regions as a function of the solar wind properties. Such a methodology, although extensively used in the industry, is still very novel in space physics. With the help of local experts, the PhD student will first implement and test the machine learning algorithms to automate the selection of key regions in spacecraft data. This phase will require browsing data and labeling it, then train algorithms and evaluate their performance. Using the detected regions, the main objective will be first to build a 3D data driven model of the magnetosheath as a function of the solar wind control parameters, continuously monitored upstream of the terrestrial environment (ACE and WIND missions). This model would include: - the 3D distributions of plasma densities, velocities, amplitude and orientation of the magnetic fields within the sheath -the 3D location of the sheath boundaries (shock and magnetopause) as a function of solar wind properties. The second part of the thesis will focus on magnetic reconnection occurring at the magnetopause. Using machine learning to automatically detect reconnection signatures such as plasma jets, the student will build a surface representation of magnetopause flows which would be a key to understand when, where and how reconnection occurs as a function of solar wind and sheath properties. This long standing question, of both fundamental and pragmatic interests, has only been addressed with case or rough statistical approaches so far. Exploiting these statistical methods of machine learning should greatly enhance our community's capability of characterize the properties of our space environment and improve our understanding of the global aspects of the interactions between the solar wind and the terrestrial and planetary magnetospheres.