🏠 Trang chủ
Benchmark
📊 Tất cả benchmark 🦖 Khủng long v1 🦖 Khủng long v2 ✅ Ứng dụng To-Do List 🎨 Trang tự do sáng tạo 🎯 FSACB - Trình diễn cuối cùng 🌍 Benchmark dịch thuật
Mô hình
🏆 Top 10 mô hình 🆓 Mô hình miễn phí 📋 Tất cả mô hình ⚙️ Kilo Code
Tài nguyên
💬 Thư viện prompt 📖 Thuật ngữ AI 🔗 Liên kết hữu ích

Thuật ngữ AI

Từ điển đầy đủ về Trí tuệ nhân tạo

162
danh mục
2.032
danh mục con
23.060
thuật ngữ
📂
danh mục con

Stochastic Markov Decision Processes

MDP where transitions and rewards follow probabilistic distributions, modeling environmental uncertainty.

17 thuật ngữ
📂
danh mục con

Monte Carlo Methods in RL

Algorithms using repeated random sampling to estimate state-action values in stochastic environments.

14 thuật ngữ
📂
danh mục con

Stochastic Policies

Strategies returning probability distributions over actions rather than deterministic actions.

11 thuật ngữ
📂
danh mục con

Bayesian Reinforcement Learning

Approach handling uncertainty over model parameters using probability distributions.

9 thuật ngữ
📂
danh mục con

Multi-armed Stochastic Bandits

Exploration-exploitation problem where each arm has an unknown stochastic reward distribution.

7 thuật ngữ
📂
danh mục con

Bootstrap Methods in RL

Techniques using resampling to quantify uncertainty in value estimates.

15 thuật ngữ
📂
danh mục con

Gaussian Processes for RL

Using Gaussian processes to model uncertainty in the value or transition function.

10 thuật ngữ
📂
danh mục con

Ensemble Methods in Stochastic RL

Combination of multiple estimators to capture epistemic uncertainty in learning.

19 thuật ngữ
📂
danh mục con

Distributional Reinforcement Learning

Learning the full distribution of returns rather than only their expected value.

5 thuật ngữ
📂
danh mục con

Quantile Regression DRL

Specific approach of distributional RL using quantile regression to model uncertainty.

8 thuật ngữ
📂
danh mục con

Partially Observable Stochastic MDPs

Extension of stochastic MDPs with partial observation, increasing uncertainty about the state.

8 thuật ngữ
📂
danh mục con

Stochastic Optimization in RL

Optimization methods accounting for noise and uncertainty in gradients and updates.

10 thuật ngữ
🔍

Không tìm thấy kết quả