Algoritmos UCB
KL-UCB
Variante do UCB que utiliza a divergência de Kullback-Leibler para construir limites de confiança assintoticamente ótimos, particularmente adequada para recompensas limitadas.
← Voltar