Analyse de données d'exploration sismique par l'apprentissage automatique.

par Valentin Tschannen

Projet de thèse en Sciences de la Terre et de l'environnement

Sous la direction de Manuel Pubellier et de Matthias Delescluse.

Thèses en préparation à Paris Sciences et Lettres , dans le cadre de Sciences de la Terre et de l'environnement et physique de l'Univers Paris , en partenariat avec Laboratoire de Géologie de l'Ecole Normale Supérieure (laboratoire) et de Ecole normale supérieure (établissement de préparation de la thèse) depuis le 01-09-2016 .


  • Résumé

    L'étude de la subsurface vise à révéler l'état actuel et à comprendre l'histoire d'une zone géologique. Par le biais de mesures directes et indirectes, nous cherchons à décrire la lithologie et la stratigraphie de la zone, à distinguer des caractéristiques géologiques telles que des réseaux de failles et de fractures et d'en déduire ses propriétés physiques. Ces études sont e.g précieuses pour l'exploration et la caractérisation des réservoirs d'hydrocarbures, l'exploitation de l'énergie géothermique et le stockage de CO2. L'imagerie du sous-sol aide également à comprendre les processus liés aux tremblements de terre, ainsi que l'évaluation de la stabilité des pentes (par exemple des glissements de terrain sous-marins) ... Les sources les plus courantes d'information pour l'interprétation d'un réservoir proviennent de mesures sismiques, électromagnétiques, gravimétriques et de puits. Une fois traitées, les interpréteurs se retrouvent avec d'énormes quantités de données à partir desquelles ils peuvent calculer et inverser une multitude d'attributs et s'en servir pour mieux mettre en évidence les caractéristiques ciblées. La très grande quantité d'informations que nous avons à traiter combinée avec les problèmes non résolus dans les données et la complexité géologique des structures font de l'interprétation du sous-sol un problème épineux. Malgré les progrès dans la visualisation et des outils automatisés, ce processus est encore lent et consomme d'énormes ressources humaines. Le champ disciplinaire maintenant très populaire de l'apprentissage automatique a été précisément conçu pour trouver des motifs caractéristiques parmi une grande variété de types de données. Les algorithme sont écrits d'une manière qui rend possible pour le programme d ' «apprendre» dans un processus itératif et gagner progressivement en précision dans le but d'identifier les éléments d'intérêts. Cette méthode peut être abordée de plusieurs manières différentes d'un fonctionnement purement sans supervision où nous comptons uniquement sur les statistiques des données sans donner aucune connaissance préalable à l'algorithme, à l'apprentissage supervisé où l'interpréteur «enseigne» à l'algorithme en lui fournissant des exemples. L'utilité de l'apprentissage de la machine est déjà apprécié dans de nombreux autres domaines, et les applications à l'interprétation sismique sont en croissance (voir, par exemple la session EAGE 2016 à propos de "Interprétation automatisée"). Nous proposons un sujet de thèse visant à renforcer la réalisation de tâches particulières où l'apprentissage supervisé et purement non supervisé sont combinés pour obtenir un meilleur résultat. Ces tâches pourraient être la détermination des failles et des systèmes de canaux, de délimitation des horizons géologiques et la détection d'éléments stratigraphiques. D'autres aspects de la recherche pourrait être de vérifier la validité des résultats et des technologies particulières appliquées à des données dont l'acquisition et le traitement sont différents.

  • Titre traduit

    Analysis of seismic data using machine learning.


  • Résumé

    Sub-surface geoscience aims at revealing the present state and understanding the history of a geological zone of interest. By the means of direct and indirect measurements we seek to describe the lithology and stratigraphy of the area, to outline its discrete geological features such as fault and fracture networks and to infer its physical properties. These study are e.g valuable for the exploration and characterization of hydrocarbon reservoirs, the exploitation of geothermal energy and the storage of CO2. Imaging the sub-surface also helps deciphering processes related to earthquakes and faults activity, as well as assessing slope stability (e.g. submarine landslides)... The most prevalent sources of information for reservoir interpretation come from seismic, electromagnetic,gravimetric and well-bore petrophysical measurements. Once processed, interpreters are left with huge datasets from which they can derive and invert for a multitude of attributes serving the purpose of better highlighting the targeted features. The very large amount of information we have to deal with combined with the unsolved issues of the data and the geological complexity of the remaining fields make sub-surface interpretation a thorny problem. Despite advances in visualization and automated tools, this process is still slow and consumes huge human resources. The now very popular field of machine learning was precisely developed to find patterns and regularities among a wide variety of data types (see [1] for a good introduction). Algorithm are written in a way that make it possible for the program to "learn" in an iterative process and progressively gain in precision toward the goal of identifying features of interests. This data driven method can be approached in many different manners from a purely unsupervised functioning where we rely only on the statistics of the data without giving any prior knowledge to the algorithm, to supervised learning where the interpreter is "teaching" the algorithm by providing it with examples. The value of machine learning is already appreciated in many other domains, and applications to seismic interpretation are growing (see e.g the EAGE 2016 session about "Automated Interpretation"). Using the privileged environment of the Fraunhofer HPC department, where resources for high performance data analysis and software developed in collaboration with the company Sharp Reflections for the visualization, processing and interpretation of seismic and petrophysical data are available, we want to further investigate possibilities offered by the combination of the two worlds. We propose a PhD topic aiming at enhancing the realization of particular tasks where interactively supervised and purely unsupervised learning are combined to achieve an improved result. Such tasks could deal with fault and channel systems delineation, horizons picking, lithofacies classification, detection of stratigraphic elements or seismic to well ties. Others aspect of research could be to investigate the transferability of results and of particular technologies applied across datasets with different acquisition parameters and processing and across different geological settings. These approaches also seem to be ideal when dealing with multi-geophysical data. The first worflow we would like to adapt to the needs of interpretation and investigate belongs to the category of reinforcement learning. It can be viewed as two separate steps realized in an iterative procedure. The first step consists in an unsupervised deep-learning process where the user provides a set of uninterpreted attributes. The algorithm will generate a "code-book" from those input which consist of a non-linear combination of all the attributes that statistically best represent the features present in the data. The second step is a supervised approach that belongs to the family of "random forests ensemble learning". The interpreter now gives explicit labels (e.g using sparse information from wells), and from the generated code-book the algorithm will localize area in the data that best resemble the given labels. Once stagnation in the results are observed we then come back to step one, but this time the learning procedure will be influenced by the knowledge gained during the second step. A new code-book better at representing the targeted features will be generated and the iterative procedure can be carried on until satisfactory results are achieved. Challenges with this approach will be to make it interactive, compute time should be small enough and good viewing capabilities given to the user. Using appropriate datasets we plan to investigate the robustness of the method to subjectivity in interpretation and hope to demonstrate that this human-machine interaction can reduce the lengthiness of the process. We believe we will greatly benefit from a collaboration with the ENS Paris since the Laboratoire de Géologie could provide various seismic datasets from several acquisition systems in many different geological contexts and will also advise on structural and sedimentary interpretation.