Glossário IA
O dicionário completo da Inteligência Artificial
Jogo de Soma Zero
Cenário teórico onde o ganho total de um agente corresponde exatamente à perda de outro, fundamental no aprendizado adversarial multiagente para modelar competições estritas.
Algoritmo Minimax
Algoritmo de decisão que maximiza o ganho mínimo possível em situações adversarial, usado para desenvolver estratégias robustas contra as piores ações do adversário.
Equilíbrio de Nash
Estado estável onde nenhum agente pode melhorar sua estratégia modificando unilateralmente seu comportamento, crucial para analisar pontos de equilíbrio no MARL adversarial.
Auto-jogo
Metodologia de treinamento onde um agente aprende competindo contra cópias de si mesmo com estratégias evolutivas, eliminando a necessidade de dados externos.
Política Robusta
Política de aprendizado por reforço que mantém alto desempenho diante de perturbações adversarial ou mudanças inesperadas no ambiente.
Otimização do Pior Caso
Paradigma de otimização visando maximizar o desempenho nos cenários mais desfavoráveis, essencial para desenvolver agentes resilientes a ataques adversarial.
Ataque Adversarial
Ação deliberada de um agente visando degradar o desempenho de outro agente através da manipulação do ambiente ou injeção de perturbações maliciosas.
Estratégia de Defesa
Conjunto de mecanismos e políticas projetados para detectar, contra-atacar e recuperar de ataques adversarial em sistemas multiagentes.
Ambiente Adversarial
Ambiente de aprendizagem projetado para apresentar ativamente desafios e obstáculos aos agentes, simulando condições reais hostis ou imprevisíveis.
Destilação de Política
Técnica de transferência de conhecimento onde uma política complexa aprendida por um agente é comprimida em uma forma mais simples e eficiente, frequentemente utilizada após o treinamento adversarial.
Aprendizado por Reforço Adversarial
Paradigma de aprendizado por reforço que integra explicitamente agentes adversários no processo de treinamento para melhorar a robustez e as capacidades de generalização.
Bandido Adversarial Multiagente
Extensão do problema dos bandidos onde múltiplos agentes interagem em um ambiente com recompensas potencialmente manipuladas por adversários.
Aprendizado por Imitação Adversarial
Abordagem de aprendizado por imitação usando discriminadores adversariais para avaliar e melhorar a qualidade do comportamento imitado em relação aos especialistas.
Teste de Robustez
Avaliação sistemática do desempenho dos agentes diante de cenários extremos e ataques coordenados para medir sua resiliência e identificar vulnerabilidades.
Perturbação Adversarial
Modificação sutil mas intencional das observações ou do ambiente projetada para induzir erros na tomada de decisão de um agente alvo.
Incerteza Estratégica
Incerteza quanto às intenções e estratégias futuras dos adversários, exigindo abordagens probabilísticas e adaptativas na tomada de decisão multiagente.
MARL Baseado em Teoria dos Jogos
Aplicação da teoria dos jogos ao aprendizado por reforço multiagente para analisar e otimizar comportamentos estratégicos em contextos competitivos.