Odalric-Ambrym Maillard
IdRefMots clés
FR |
EN
Apprentissage automatique
Apprentissage par renforcement (intelligence artificielle)
Apprentissage par renforcement
Optimisation mathématique
Problème du bandit manchot
Apprentissage statistique
Intelligence artificielle
Réseaux neuronaux (informatique)
Prise de décision (statistique)
Problèmes de bandits
Identification de meilleur bras
Statistiques séquentielles
Markov, Processus de
Analyse de régression
Bandits manchots
Bandits stochastiques
Apprentissage séquentiel
Gestion de flexibilités électriques
Prévision de la demande électrique
Auto-Encodeur variationnel conditionnel