Alexandra Carpentier
IdRefMots clés
FR |
EN
Apprentissage automatique
Apprentissage par renforcement (intelligence artificielle)
Modèles linéaires (statistique)
Transition de phase
Statistique non paramétrique
Analyse séquentielle
Analyse de régression
Apprentissage par renforcement
Algorithmes
Monte-Carlo, Méthode de
Grande dimension
Regression linéaire
Clustering
Variables instrumentales (statistique)
Minimisation du risque empirique
Ordonnancement
Bandit manchot
Bandits stochastiques à plusieurs bras
Statistiques adaptatives
Algorithme Upper Confidence Bound (UCB)