Deep learning pour la prévision spatio-temporelle: application à la production photovoltaïque

par Vincent Le Guen

Projet de thèse en Informatique

Sous la direction de Nicolas Thome.

Thèses en préparation à Paris, CNAM , dans le cadre de École doctorale Informatique, télécommunications et électronique (Paris) , en partenariat avec Centre d'études et de recherche en informatique et communications (Paris) (laboratoire) et de MSDMA - Méthodes Statistiques de Data-Mining et Apprentissage (equipe de recherche) depuis le 01-11-2018 .


  • Résumé

    Les énergies renouvelables sont en forte progression dans le monde ces dernières années. Toutefois, leur variabilité spatiale et temporelle reste un défi pour leur intégration à grande échelle dans les réseaux électriques existants, pour lesquels l'équilibre à tout instant entre production et consommation d'électricité est primordial. L'enjeu réside également dans le pilotage indépendant de parcs photovoltaïques ou éoliens qui peuvent être couplés à des moyens de stockage ou de production supplémentaires, notamment dans les systèmes insulaires isolés. Dans ce contexte, EDF a engagé depuis plusieurs années des travaux sur la prévision de production photovoltaïque, à différents horizons temporels et à l'aide de différentes données d'entrée (modèles météorologiques, images satellites, images au sol, mesures en temps réel). L'amélioration des méthodes de prévision à court terme (de quelques minutes à une heure) est aujourd'hui un enjeu fondamental. La variabilité temporelle à court-terme de la production photovoltaïque est principalement liée à des phénomènes physiques météorologiques, tels que le déplacement des nuages. L'utilisation de caméras au sol hémisphériques est une piste très prometteuse pour suivre les nuages et anticiper les variations brusques de production à quelques minutes. EDF dispose de plusieurs sites instrumentés de caméras hémisphériques et de capteurs de rayonnement solaire (pyranomètres), constituant ainsi une base de données annotées de plusieurs millions d'images du ciel au pas de temps 10s. Par ailleurs, avec la multiplication des installations solaires sur le territoire, la prévision de production d'un site pourra être améliorée par les données de sites voisins ou distants, observant en avance des phénomènes météorologiques en mouvement. Des premiers travaux à EDF ont montré le gain de performance considérable des réseaux de neurones profonds (approche « deep learning ») pour estimer les rayonnements solaires à un instant donné à partir des images au sol, par rapport aux méthodes d'apprentissage précédentes. L'ambition de cette thèse est de faire émerger des architectures de réseaux de neurones adaptées au traitement et à la prévision de phénomènes spatio-temporels. Les données d'entrée seront des images au sol, des images satellite, des sorties de modèles météorologiques ou des remontées de production des parcs. La fusion de ces différentes sources d'informations sera étudiée pour améliorer les prévisions à différents niveaux d'agrégation spatiaux et horizons temporels. Une piste de recherche prometteuse est également d'incorporer de l'information sur la physique des phénomènes météorologiques dans les modèles d'apprentissage basés uniquement sur les données. Afin d'anticiper des variations brusques de production (rampes), une réflexion sera à mener sur la meilleure fonction de perte pour apprendre les architectures de réseaux proposées, la perte quadratique classique étant mal adaptée pour quantifier le retard d'une prédiction. Enfin, la thèse s'attachera à concevoir une méthodologie de prévision de séquence spatio-temporelle la plus générique possible, pouvant d'appliquer à d'autres cas d'usage EDF dans le domaine de l'énergie (par exemple prévision de consommation électrique, d'énergie éolienne, de débit hydraulique, etc) avec des données d'entrée variées.

  • Titre traduit

    Deep learning for spatio-temporal process forecasting: application to solar energy


  • Résumé

    Renewable energies are greatly increasing worldwide. However, their spatial and temporal variability is still challenging for their integration at large scale in the existing electricity grid, for which balance between electricity consumption and production is mandatory at each instant. The challenge is also to manage independent photovoltaic or wind farms, which can be coupled with additional storage or production devices, in particular in isolated insular systems. In this context, EDF has developed a wide range of solar forecasting methods for various temporal and spatial horizons, based on several kinds of input data (numerical weather predictions, satellite imaging, ground images, real-time production measurements). Enhancing short-term forecasting algorithms (from a few minutes to one hour) is a major issue. Short-term solar production variability is mainly driven by physical meteorological processes, such as cloud motion. Using ground-based hemispherical cameras is a promising way for cloud tracking to anticipate sharp variations of production several minutes in advance. EDF has several test stations with fisheye cameras and solar irradiance measurement sensors (pyranometers). The collected database is composed of several million sky images at a 10s time step. Moreover, with the increase of solar farms installations on the territory, production forecasts for one site may be enhanced by the data from other distant sites, by observing the moving meteorological phenomena. First studies at EDF have shown the huge performance gain of a deep learning approach for estimating the solar irradiance at a given instant from the sky images, compared to the previous learning algorithms. The ambition of this thesis is to develop neural network architectures adapted to process and forecast spatio-temporal phenomena. Input data will be ground-based sky images, satellite images, numerical weather model predictions or solar farm production measurements. Fusing these varied data sources will be studied to improve forecasts at different spatial and temporal aggregation levels. Furthermore, modelling and incorporating the physics of these phenomena into the data-driven learning models is a promising way of research. In order to anticipate future sharp drops of production (ramp events), the best loss function for training the proposed neural networks should be studied, since the mean squared error is unable to quantify delays between time series. At last, this thesis will try to produce a generic methodology for spatio-temporal sequence forecasting, being able to tackle other use cases in the energy sector (electricity consumption forecasting, wind energy, hydraulic load forecasting, etc) with varied data sources.