MARL Continu
Multi-Agent Deep Deterministic Policy Gradient (MADDPG)
Algorithme CTDE étendant DDPG aux environnements multi-agents, utilisant des critiques centralisées et des acteurs décentralisés pour apprendre dans des espaces d'action continus.
← Retour