MuZero
Modelo de valor
Red neuronal en MuZero que estima el valor esperado de los estados futuros, guiando el proceso de planificación hacia las acciones más prometedoras.
← VolverRed neuronal en MuZero que estima el valor esperado de los estados futuros, guiando el proceso de planificación hacia las acciones más prometedoras.
← Volver