MARL Contínuo
Processo de Decisão de Markov Parcialmente Observável Multiagente (MPOMDP)
Formalização matemática de ambientes MARL onde cada agente possui observações parciais e deve inferir o estado global para tomar decisões ótimas.
← Voltar