RL Multi-Objetivo Contínuo
Função de Recompensa Vetorial
Função de retorno que retorna um vetor de recompensas em vez de um escalar, permitindo capturar simultaneamente múltiplos objetivos conflitantes na aprendizagem por reforço.
← Voltar