Глоссарий ИИ
Полный словарь искусственного интеллекта
Классические многорукие бандиты
Фундаментальная задача, в которой агент выбирает из нескольких вариантов для максимизации совокупной награды.
Эпсилон-жадные алгоритмы
Стратегия, которая использует известное лучшее действие с вероятностью 1-ε и исследует случайно с вероятностью ε.
Алгоритмы UCB
Методы, основанные на верхних доверительных границах, которые балансируют исследование и использование с помощью статистических интервалов.
Сэмплирование Томпсона
Байесовский подход, который выбирает параметры в соответствии с их апостериорным распределением для принятия решений.
Контекстуальные бандиты
Расширение, в котором решения зависят от контекстуальных характеристик, наблюдаемых на каждом ходу.
Линейные бандиты
Модели, в которых ожидаемое вознаграждение является линейной функцией от контекстуальных признаков.
Нестационарные бандиты
Ситуация, в которой распределения вознаграждения изменяются со временем, требуя постоянной адаптации.
Комбинаторные бандиты
Проблемы, в которых агент одновременно выбирает наборы действий со структурными ограничениями.
Bandits Adversaires
Scénario où un adversaire choisit les récompenses pour minimiser le gain de l'agent.
Bandits en Cascade
Modèle où les items sont présentés séquentiellement jusqu'à ce que l'utilisateur clique sur l'un d'entre eux.
Bandits avec Feedback Limité
Situations où seule une information partielle sur les récompenses est observée après chaque action.
Bandits pour Publicité Online
Application spécifique pour l'optimisation des campagnes publicitaires en temps réel.
Bandits pour Tests A/B
Alternative intelligente aux tests A/B traditionnels pour l'optimisation des expériences web.
Bandits pour Recommandations
Systèmes qui apprennent les préférences utilisateur pour personnaliser les recommandations.
Bandits Hiérarchiques
Structures multi-niveaux où les décisions sont organisées en hiérarchie pour des problèmes complexes.