Glossário IA
O dicionário completo da Inteligência Artificial
Bandidos Multi-braços Clássicos
Problema fundamental onde o agente escolhe entre várias opções para maximizar a recompensa cumulativa.
Algoritmos Epsilon-Guloso
Estratégia que explora a melhor ação conhecida com probabilidade 1-ε e explora aleatoriamente com probabilidade ε.
Algoritmos UCB
Métodos baseados em limites superiores de confiança que equilibram exploração e explotação através de intervalos estatísticos.
Thompson Sampling
Abordagem bayesiana que amostra parâmetros de acordo com sua distribuição posterior para tomar decisões.
Bandidos Contextuais
Extensão onde as decisões dependem de características contextuais observadas a cada rodada.
Bandidos Lineares
Modelos onde a recompensa esperada é uma função linear das características contextuais.
Bandidos Não Estacionários
Contexto onde as distribuições de recompensa mudam ao longo do tempo, exigindo adaptação contínua.
Bandidos Combinatórios
Problemas onde o agente seleciona conjuntos de ações simultaneamente com restrições estruturais.
Bandidos Adversários
Cenário onde um adversário escolhe as recompensas para minimizar o ganho do agente.
Bandidos em Cascata
Modelo onde os itens são apresentados sequencialmente até que o usuário clique em um deles.
Bandidos com Feedback Limitado
Situações onde apenas informação parcial sobre as recompensas é observada após cada ação.
Bandidos para Publicidade Online
Aplicação específica para a otimização de campanhas publicitárias em tempo real.
Bandidos para Testes A/B
Alternativa inteligente aos testes A/B tradicionais para a otimização das experiências web.
Bandidos para Recomendações
Sistemas que aprendem as preferências do usuário para personalizar as recomendações.
Bandidos Hierárquicos
Estruturas multinível onde as decisões são organizadas em hierarquia para problemas complexos.