Непрерывное многоцелевое обучение с подкреплением
Декомпозиция пространства действий
Техника, разделяющая непрерывное пространство действий на специализированные подпространства для каждой цели, облегчающая многоцелевую оптимизацию в сложных средах.
← Назад