Glossário IA
O dicionário completo da Inteligência Artificial
Aprendizagem por Transferência com Modelos
Técnica onde um modelo de dinâmica aprendido num ambiente fonte é usado para acelerar a aprendizagem num ambiente alvo, transferindo o conhecimento da estrutura do mundo em vez das políticas diretamente.
Modelo de Dinâmica Transferível
Representação matemática das transições de estado de um ambiente, projetada para ser reutilizável entre diferentes tarefas ou ambientes que partilham características físicas ou estruturais comuns.
Aprendizagem por Reforço Baseada em Modelos
Paradigma onde o agente constrói um modelo interno do ambiente para planear e simular trajetórias antes de agir no mundo real, reduzindo assim a necessidade de interações dispendiosas.
Generalização de Modelo
Capacidade de um modelo de dinâmica de fazer previsões precisas para estados ou ações não observados durante o treino, essencial para a transferência bem-sucedida entre ambientes.
Viés de Transferência de Modelo
Erro sistemático introduzido quando um modelo aprendido num ambiente fonte é aplicado a um ambiente alvo com dinâmicas ligeiramente diferentes, necessitando de técnicas de adaptação.
Meta-Aprendizagem de Modelos
Abordagem onde se aprende a aprender modelos de dinâmica que podem adaptar-se rapidamente a novos ambientes com poucos dados, otimizando os parâmetros de inicialização do modelo.
Codificação de Ambiente Latente
Representação compacta das características essenciais de um ambiente num espaço latente, permitindo capturar as similaridades entre diferentes ambientes para facilitar a transferência de modelos.
Calibração de Modelo Transferido
Processo de ajuste das previsões de um modelo transferido para corresponder às estatísticas do ambiente alvo, muitas vezes realizado por técnicas de regressão ou adaptação bayesiana.
Transferência Multi-Modelos
Estratégia que utiliza um conjunto de modelos especializados aprendidos em diferentes ambientes de origem, combinados para formar um modelo híbrido robusto no ambiente alvo.
Espaço de Tarefas Fatorizado
Decomposição das variações entre ambientes em fatores independentes, permitindo a transferência seletiva de componentes de modelo relevantes enquanto adapta os outros.
Aprendizagem por Reforço Hierárquica com Modelos
Arquitetura onde modelos de dinâmica em diferentes escalas temporais ou espaciais são transferidos, permitindo um planeamento hierárquico eficaz em novos ambientes.
Destilação de Conhecimento de Modelo
Técnica de compressão onde um grande modelo de dinâmica de origem ensina as suas previsões a um modelo mais compacto e transferível, preservando as capacidades de generalização.
Adaptação de Domínio para Modelos de Dinâmica
Conjunto de métodos que visam ajustar um modelo de dinâmica pré-treinado para funcionar num novo domínio, minimizando a divergência entre as distribuições de origem e alvo.
Transferência Zero-Shot de Modelos
Capacidade de um modelo de dinâmica de funcionar num ambiente inteiramente novo sem qualquer adaptação, graças a uma generalização extrema das estruturas aprendidas.
Modelo Gráfico de Transição
Representação das dinâmicas do ambiente sob a forma de um grafo onde os nós são estados e as arestas são transições probabilísticas, facilitando a transferência de estrutura entre ambientes semelhantes.
Aprendizagem Contínua de Modelos
Paradigma onde o modelo de dinâmica é continuamente atualizado durante a interação com novos ambientes, preservando o conhecimento adquirido anteriormente.
Transferência por Composição de Modelos
Método onde modelos elementares aprendidos em subtarefas simples são combinados para formar um modelo complexo capaz de gerenciar um novo ambiente composto.
Incerteza Epistêmica na Transferência
Quantificação da incerteza do modelo devido à falta de conhecimento em regiões do espaço de estados não exploradas no ambiente de origem, crucial para uma transferência segura.
Modelo Neural Simbólico Híbrido
Arquitetura que combina redes neurais para a aprendizagem de dinâmicas complexas com componentes simbólicos transferíveis que representam as restrições físicas fundamentais.
Transferência Intertemporal de Modelos
Aplicação de um modelo de dinâmica aprendido em uma determinada escala temporal para operar eficientemente em diferentes escalas temporais no ambiente alvo.