Глубокое Многоцелевое РЛ
Многокритериальный PPO
Адаптация алгоритма Proximal Policy Optimization для многокритериальных сред, одновременно оптимизирующая несколько целевых функций. Алгоритм поддерживает ограничения близости, исследуя пространство компромиссов между целями.
← Назад