MuZero
Modelo de Valor
Rede neural em MuZero que estima o valor esperado de estados futuros, guiando o processo de planeamento para as ações mais promissoras.
← VoltarRede neural em MuZero que estima o valor esperado de estados futuros, guiando o processo de planeamento para as ações mais promissoras.
← Voltar