RL মাল্টি-অবজেক্টিভস কন্টিনিউ
কন্টিনিউয়াস অ্যাকশন স্পেস আরএল
রিইনফোর্সমেন্ট লার্নিংয়ের একটি প্যারাডাইম যেখানে এজেন্ট অবিচ্ছিন্ন ক্রিয়াগুলির একটি অসীম সেট থেকে বেছে নিতে পারে, যার জন্য PPO বা SAC-এর মতো উপযুক্ত অপ্টিমাইজেশন অ্যালগরিদমের প্রয়োজন হয়।
← ফিরে যান