Многоагентное многоцелевое обучение с подкреплением
Векторная функция полезности
Математическое представление многоцелевых предпочтений агента в виде вектора, где каждая компонента соответствует конкретной цели для оптимизации.
← Назад