モデルベースの好奇心に基づく学習
ダイナミクスモデル
エージェントが学習するモデルで、現在の状態と実行されたアクションを与えられたときに環境の進化、つまり次の状態または次の観測を予測します。このモデルの品質は、モデルベースの好奇心学習において中心的です。
← 戻るエージェントが学習するモデルで、現在の状態と実行されたアクションを与えられたときに環境の進化、つまり次の状態または次の観測を予測します。このモデルの品質は、モデルベースの好奇心学習において中心的です。
← 戻る