Обучение путем предсказания траекторий
Буфер воображаемого опыта
Структура данных, хранящая смоделированные траектории, сгенерированные моделью для обучения, дополняя реальный опыт, собранный в среде.
← Назад