Q-Learning Multiobjetivo
Vetor de Recompensa
Vetor de recompensas multidimensional onde cada componente corresponde à recompensa associada a um objetivo específico, substituindo o sinal de recompensa escalar tradicional.
← Voltar