Apprentissage par Renforcement Stochastique

📂

sous-catégories

Processus de Décision Markoviens Stochastiques

MDP où les transitions et récompenses suivent des distributions probabilistes, modélisant l'incertitude environnementale.

17 termes

📂

sous-catégories

Méthodes Monte Carlo en RL

Algorithmes utilisant l'échantillonnage aléatoire répété pour estimer les valeurs d'état-action dans des environnements stochastiques.

14 termes

📂

sous-catégories

Politiques Stochastiques

Stratégies retournant des distributions de probabilités sur les actions plutôt que des actions déterministes.

11 termes

📂

sous-catégories

Apprentissage par Renforcement Bayésien

Approche traitant l'incertitude sur les paramètres du modèle en utilisant des distributions de probabilité.

9 termes

📂

sous-catégories

Bandits Stochastiques Multi-bras

Problème d'exploration-exploitation où chaque bras a une distribution de récompense stochastique inconnue.

7 termes

📂

sous-catégories

Méthodes Bootstrap en RL

Techniques utilisant le rééchantillonnage pour quantifier l'incertitude dans les estimations de valeur.

15 termes

📂

sous-catégories

Processus Gaussiens pour RL

Utilisation de processus gaussiens pour modéliser l'incertitude dans la fonction de valeur ou de transition.

10 termes

📂

sous-catégories

Méthodes d'Ensemble en RL Stochastique

Combinaison de multiples estimateurs pour capturer l'incertitude épistémique dans l'apprentissage.

19 termes

📂

sous-catégories

Distributional Reinforcement Learning

Apprentissage de la distribution complète des retours plutôt que seulement leur espérance mathématique.

5 termes

📂

sous-catégories

Quantile Regression DRL

Approche spécifique du distributional RL utilisant la régression quantile pour modéliser l'incertitude.

8 termes

📂

sous-catégories

MDP Partiellement Observables Stochastiques

Extension des MDP stochastiques avec observation partielle, augmentant l'incertitude sur l'état.

8 termes

📂

sous-catégories

Optimisation Stochastique en RL

Méthodes d'optimisation tenant compte du bruit et de l'incertitude dans les gradients et mises à jour.

10 termes

Glossaire IA

Processus de Décision Markoviens Stochastiques

Méthodes Monte Carlo en RL

Politiques Stochastiques

Apprentissage par Renforcement Bayésien

Bandits Stochastiques Multi-bras

Méthodes Bootstrap en RL

Processus Gaussiens pour RL

Méthodes d'Ensemble en RL Stochastique

Distributional Reinforcement Learning

Quantile Regression DRL

MDP Partiellement Observables Stochastiques

Optimisation Stochastique en RL

Aucun résultat trouvé