Aprendizagem por Dyna-Q
Dyna-Q+
Extensão do Dyna-Q que integra um mecanismo de exploração baseado no tempo decorrido desde a última visita a um par estado-ação para detectar e adaptar-se a mudanças ambientais.
← Voltar