Глоссарий ИИ
Полный словарь искусственного интеллекта
Дифференцируемая модель перехода
Математическая функция, описывающая эволюцию состояния непрерывной системы, разработанная для дифференцируемости с целью оптимизации градиентным спуском в алгоритмах обучения с подкреплением.
Стохастические обыкновенные дифференциальные уравнения (ОДУ)
Система дифференциальных уравнений, включающая случайный шумовой член, используемая для моделирования неопределенной динамики непрерывных сред при сохранении дифференцируемости, необходимой для обучения.
Дифференцируемый численный интегратор
Метод численного вычисления (например, Эйлера, Рунге-Кутты), реализация которого является дифференцируемой, позволяющий распространять градиенты через этапы временного моделирования для оптимизации динамических моделей.
Нейронная сеть с радиальными базисными функциями (RBF)
Архитектура нейронной сети, использующая радиальные базисные функции в качестве функций активации, особенно подходящая для аппроксимации непрерывных дифференцируемых функций для моделирования динамики.
Планирование по оптимизированной траектории (TPO)
Метод планирования в пространстве траекторий, который напрямую оптимизирует последовательность действий с использованием дифференцируемой модели с обновлениями на основе градиентов ожидаемой награды.
Моделирование с помощью гамильтоновых систем
Подход к моделированию непрерывной динамики на основе принципов сохранения энергии в гамильтоновых системах, обеспечивающий свойства стабильности и дифференцируемости в долгосрочной перспективе.
Автоматическое дифференцирование во времени
Техника вычисления градиентов, которая распространяет обратное распространение через временные этапы непрерывного моделирования, необходимая для обучения дифференцируемых динамических моделей.
Временная гауссовская модель процесса (TGPM)
Расширение гауссовских процессов для моделирования непрерывных временных рядов, обеспечивающее калиброванную неопределенность при сохранении дифференцируемости для оптимизации в обучении с подкреплением.
Contrôleur Neuronal Différentiable
Réseau neuronal implémentant une politique de contrôle dont les sorties sont des fonctions différentiables des états d'entrée, permettant l'optimisation conjointe avec le modèle de dynamique dans des cadres model-based.
Méthode de Tir Multiple Différentiable
Algorithme de résolution de problèmes aux limites pour les systèmes continus, adapté pour être différentiable et ainsi permettre l'optimisation de paramètres dans les trajectoires d'apprentissage par renforcement.
Modèle d'Espace d'États à Fonctions de Base
Représentation de la dynamique continue où les transitions d'états sont approximées par une combinaison linéaire de fonctions de base différentiables, facilitant l'optimisation analytique des paramètres du modèle.
Optimisation de Politique par Modèle Différentiable (DMPO)
Variante de l'optimisation de politique où les gradients sont calculés à travers un modèle de dynamique différentiable, combinant les avantages des méthodes model-based et model-free pour les environnements continus.
Équation de la Dynamique Apprise (LDE)
Formulation mathématique où les paramètres d'une équation différentielle décrivant la dynamique du système sont appris par optimisation, tout en conservant la structure différentiable de l'équation originale.
Modèle Hybride Continu-Discret Différentiable
Architecture de modélisation combinant des composantes continues différentiables avec des événements discrets, où les transitions sont lissées pour maintenir la différentiabilité globale du système.
Prédiction d'État par Intégration Différentiable
Processus de prédiction des états futurs utilisant une intégration numérique dont l'opération est elle-même différentiable, permettant de calculer les gradients de la prédiction par rapport aux paramètres du modèle.
Réseau de Neurones Physiquement Informé (PINN)
Architecture neuronale qui intègre des équations différentielles issues de la physique dans sa fonction de perte, garantissant que le modèle appris respecte les lois de conservation tout en restant différentiable.
Метод дифференцируемой коллокации
Техника решения задач оптимизации с ограничениями для непрерывных систем, где ограничения коллокации формулируются как дифференцируемые функции для обучения политик.
Модель перехода на основе уравнений Навье-Стокса
Использование уравнений Навье-Стокса, сделанных дифференцируемыми путем подходящей дискретизации, для моделирования динамики жидкостей в средах непрерывного обучения с подкреплением.
Оптимизация с использованием дифференцируемого расширенного лагранжиана
Метод оптимизации с ограничениями, где функция расширенного лагранжиана дифференцируема по переменным состояния и управления, что позволяет использовать ее в циклах обучения с подкреплением.