MARL Continu
Многопользовательское обучение с подкреплением
Парадигма обучения, в которой несколько агентов одновременно учатся принимать решения в общей среде, взаимодействуя друг с другом для оптимизации коллективных или индивидуальных целей.
← Назад