Thèse soutenue

Prévision court terme de la production éolienne par Machine learning

FR  |  
EN
Auteur / Autrice : Mamadou Dione
Direction : Éric Matzner-Løber
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 10/06/2020
Etablissement(s) : Institut polytechnique de Paris
Ecole(s) doctorale(s) : École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Centre de recherche en économie et statistique (France)
: École nationale de la statistique et de l'administration économique (Palaiseau, Essonne)
Jury : Président / Présidente : Erwan Le Pennec
Examinateurs / Examinatrices : Éric Matzner-Løber, Erwan Le Pennec, François Husson, Sylvain Sardy, Anne Ruiz-Gazen
Rapporteurs / Rapporteuses : François Husson, Sylvain Sardy

Résumé

FR  |  
EN

La loi de transition énergétique votée par l’Etat français a des implications précises sur les énergies renouvelables, en particulier sur leur mécanisme de rémunération. Jusqu’en 2015, un contrat d’obligation d’achat permettait de vendre l’électricité d’origine éolienne à un tarif fixe. A partir de 2015 certains parcs éoliens ont commencé à sortir de l’obligation d’achat. En effet, l’énergie éolienne commence à être directement vendue sur le marché par les producteurs à cause de la rupture des contrats d’obligation d’achat. Les gestionnaires de réseaux de distribution et les gestionnaires de réseaux de transport demandent ou même obligent les producteurs à fournir au moins des prévisions de production un jour à l’avance pour rééquilibrer le marché. Une surestimation ou une sous-estimation pourrait être exposée à des pénalités. Il existe donc un besoin énorme de prévisions précises. C’est dans ce contexte que cette thèse a été lancée avec pour objectif de proposer un modèle de prévision de la production des parcs éoliens par apprentissage statistique. Nous disposons de données de production et de mesures réelles du vent ainsi que des données de modèles météorologiques. Nous avons d’abord comparé les performances des modèles GFS et ECMWF et étudié les relations entre ces deux modèles par l’analyse de corrélation canonique. Nous avons ensuite appliqué des modèles de machine learning pour valider un premier modèle de prévision par forêts aléatoires. Nous avons ensuite modélisé la dynamique spatio-temporelle du vent et l’avons intégrée dans le modèle de prévision ce qui a amélioré l’erreur de prévision de 3%. Nous avons aussi étudié la sélection de points de grille par une mesure d’importance de groupe de variables à l’aide des forêts aléatoires. Les intervalles de prévision par forêt aléatoire associés aux prévisions ponctuelles de la production des parcs éoliens sont aussi étudiés. Le modèle de prévisions découlant de ces travaux a été développé pour permettre au Groupe ENGIE d’avoir chaque jour ses propres prévisions pour l’ensemble de ses parcs éoliens.