Aller directement à la barre de recherche

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Christophe Thiéry

Mots clés

FR

Contrôle optimal stochastique

Apprentissage par renforcement

Programmation dynamique

Processus Décisionnels de Markov

Least-Squares Policy Iteration

[lambda]-Policy Iteration

Approximation de la fonction de valeur

Compromis biais-variance, Fonctions de base

Méthode d'entropie croisée

Itération (mathématiques)

Markov, Processus de -- Solutions numériques

Approximation stochastique

Intelligence artificielle répartie

Systèmes adaptatifs