🏠 Accueil
Benchmarks
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 Glossaire IA 🔗 Liens Utiles

Glossaire IA

Le dictionnaire complet de l'Intelligence Artificielle

242
catégories
3 353
sous-catégories
40 780
termes
📂
sous-catégories

Processus de Décision Markoviens Stochastiques

MDP où les transitions et récompenses suivent des distributions probabilistes, modélisant l'incertitude environnementale.

17 termes
📂
sous-catégories

Méthodes Monte Carlo en RL

Algorithmes utilisant l'échantillonnage aléatoire répété pour estimer les valeurs d'état-action dans des environnements stochastiques.

14 termes
📂
sous-catégories

Politiques Stochastiques

Stratégies retournant des distributions de probabilités sur les actions plutôt que des actions déterministes.

11 termes
📂
sous-catégories

Apprentissage par Renforcement Bayésien

Approche traitant l'incertitude sur les paramètres du modèle en utilisant des distributions de probabilité.

9 termes
📂
sous-catégories

Bandits Stochastiques Multi-bras

Problème d'exploration-exploitation où chaque bras a une distribution de récompense stochastique inconnue.

7 termes
📂
sous-catégories

Méthodes Bootstrap en RL

Techniques utilisant le rééchantillonnage pour quantifier l'incertitude dans les estimations de valeur.

15 termes
📂
sous-catégories

Processus Gaussiens pour RL

Utilisation de processus gaussiens pour modéliser l'incertitude dans la fonction de valeur ou de transition.

10 termes
📂
sous-catégories

Méthodes d'Ensemble en RL Stochastique

Combinaison de multiples estimateurs pour capturer l'incertitude épistémique dans l'apprentissage.

19 termes
📂
sous-catégories

Distributional Reinforcement Learning

Apprentissage de la distribution complète des retours plutôt que seulement leur espérance mathématique.

5 termes
📂
sous-catégories

Quantile Regression DRL

Approche spécifique du distributional RL utilisant la régression quantile pour modéliser l'incertitude.

8 termes
📂
sous-catégories

MDP Partiellement Observables Stochastiques

Extension des MDP stochastiques avec observation partielle, augmentant l'incertitude sur l'état.

8 termes
📂
sous-catégories

Optimisation Stochastique en RL

Méthodes d'optimisation tenant compte du bruit et de l'incertitude dans les gradients et mises à jour.

10 termes
🔍

Aucun résultat trouvé