Otimização Profunda
AdaDelta
Extensão do AdaGrad que limita a janela de acumulação de gradientes passados a um tamanho fixo através de uma média móvel deslizante, evitando a diminuição agressiva da taxa de aprendizado.
← Voltar