Glosario IA
El diccionario completo de la Inteligencia Artificial
Predicción de trayectoria multipaso
Técnica que consiste en anticipar una secuencia continua de estados futuros a lo largo de varios pasos temporales para evaluar las consecuencias a largo plazo de una acción antes de su ejecución real.
Árbol de búsqueda Monte Carlo
Algoritmo de exploración arbórea que utiliza simulaciones aleatorias para evaluar las trayectorias futuras posibles desde un estado dado, optimizando la selección de acciones.
Planificación por anticipación
Proceso de evaluación secuencial de acciones futuras utilizando el modelo aprendido para seleccionar la política óptima antes de cualquier interacción con el entorno real.
Modelo de dinámica ambiental
Red neuronal entrenada para capturar las reglas físicas y los cambios de estado del entorno para predecir con precisión las consecuencias de las acciones del agente.
Imaginación de modelo
Capacidad del sistema para generar mentalmente escenarios y trayectorias alternativas utilizando su modelo interno del entorno sin interacción física.
Rollout de anticipación
Simulación completa de una secuencia de acciones desde un estado inicial utilizando el modelo aprendido para evaluar la recompensa acumulada esperada.
Aprendizaje por ensayo virtual
Paradigma donde el agente se mejora principalmente a través de experiencias simuladas en su modelo interno en lugar de por interacciones directas con el entorno.
Modelo generativo de trayectorias
Arquitectura de deep learning que genera distribuciones de trayectorias posibles en lugar de una predicción determinista, capturando la naturaleza estocástica del entorno.
Exploración por simulación
Estrategia de exploración donde el agente descubre nuevas políticas simulando masivamente escenarios en su modelo antes de probar las más prometedoras en realidad.
Predicción de estado-acción
Modelo que predice directamente el siguiente estado s(t+1) en función del estado actual s(t) y la acción a(t), formando la ecuación de transición fundamental.
Buffer de experiencia imaginaria
Estructura de datos que almacena las trayectorias simuladas generadas por el modelo para el entrenamiento, complementando la experiencia real recopilada en el entorno.
Aprendizaje de modelo mundial
Enfoque donde un único modelo aprende la dinámica completa del entorno, compartido entre todas las tareas y políticas para una mejor generalización.
Red de predicción de trayectoria
Arquitectura neuronal especializada en la predicción de secuencias de estados futuros, a menudo basada en RNN o Transformers para capturar las dependencias temporales.
Validación de modelo
Proceso sistemático de evaluación de la precisión predictiva del modelo en datos de prueba para garantizar la fiabilidad de las trayectorias simuladas.
Generación de contrafactuales
Técnica que crea trayectorias alternativas hipotéticas para entender el impacto de diferentes decisiones y mejorar la comprensión causal del modelo.