Apprentissage par renforcement 'structuré' pour la flexibilité énergétique

par Ana David

Projet de thèse en Automatique - productique

Sous la direction de Mazen Alamir.

Thèses en préparation à l'Université Grenoble Alpes , dans le cadre de École doctorale électronique, électrotechnique, automatique, traitement du signal , en partenariat avec Grenoble Images Parole Signal Automatique (laboratoire) et de Systèmes Non Linéaires et Complexes (SYSCO) (equipe de recherche) depuis le 13-01-2020 .


  • Résumé

    L'opération efficace de systèmes énergétiques, en termes de coûts aussi bien qu'en émissions de CO2, nécessite une adaptation permanente du contrôle de la « flexibilité » au contexte (météo, usages, prix d'énergie, …) dans lequel le système est opéré. La flexibilité peut être produite de différentes manières, en jouant sur des options de génération, en opérant des unités de stockage, ou en adaptant la demande à la situation. Cependant, l'impact exact des nombreuses options disponibles est souvent mal connu. Par ailleurs, le contexte est souvent soumis à des incertitudes, ce qui peut fortement dégrader la performance du système de contrôle. Le but des travaux est de déterminer si et comment l'utilisation de techniques d'apprentissage par renforcement permet d'exploiter la flexibilité et de résister aux incertitudes, en structurant l'apprentissage de manière à converger en un temps raisonnable.

  • Titre traduit

    'Structured' reinforcement learning for energy flexibility


  • Résumé

    Efficient operation of energy systems requires, in terms of cost as well as CO2 emissions, a continuous adaptation of the flexibility control to the context in which the system operates (meteorological conditions, uses, energy price, etc.). Flexibility can be generated by different manners: by controlling generation options, by operating storage units or by adapting the consumption depending on the situation. However, the exact impact of the available options is often unknown. Moreover, the context is often uncertain, which can worsen the control system performance. The purpose of the thesis is to determine if and how reinforcement learning techniques can help in exploiting flexibilities and withstand uncertainties, by structuring the learning in a way that allows convergence in a reasonable time.