Aprendizaje por Conjunto de Modelos
Robustez de Decisión
Capacidad de un agente para mantener un rendimiento aceptable frente a las incertidumbres del modelo y a las variaciones del entorno, utilizando conjuntos para evaluar la confianza de las decisiones. Crítico para el despliegue de agentes de RL en entornos reales.
← Volver