Непрерывные и дифференцируемые модели

📖

термины

Дифференцируемая модель перехода

Математическая функция, описывающая эволюцию состояния непрерывной системы, разработанная для дифференцируемости с целью оптимизации градиентным спуском в алгоритмах обучения с подкреплением.

📖

термины

Стохастические обыкновенные дифференциальные уравнения (ОДУ)

Система дифференциальных уравнений, включающая случайный шумовой член, используемая для моделирования неопределенной динамики непрерывных сред при сохранении дифференцируемости, необходимой для обучения.

📖

термины

Дифференцируемый численный интегратор

Метод численного вычисления (например, Эйлера, Рунге-Кутты), реализация которого является дифференцируемой, позволяющий распространять градиенты через этапы временного моделирования для оптимизации динамических моделей.

📖

термины

Нейронная сеть с радиальными базисными функциями (RBF)

Архитектура нейронной сети, использующая радиальные базисные функции в качестве функций активации, особенно подходящая для аппроксимации непрерывных дифференцируемых функций для моделирования динамики.

📖

термины

Планирование по оптимизированной траектории (TPO)

Метод планирования в пространстве траекторий, который напрямую оптимизирует последовательность действий с использованием дифференцируемой модели с обновлениями на основе градиентов ожидаемой награды.

📖

термины

Моделирование с помощью гамильтоновых систем

Подход к моделированию непрерывной динамики на основе принципов сохранения энергии в гамильтоновых системах, обеспечивающий свойства стабильности и дифференцируемости в долгосрочной перспективе.

📖

термины

Автоматическое дифференцирование во времени

Техника вычисления градиентов, которая распространяет обратное распространение через временные этапы непрерывного моделирования, необходимая для обучения дифференцируемых динамических моделей.

📖

термины

Временная гауссовская модель процесса (TGPM)

Расширение гауссовских процессов для моделирования непрерывных временных рядов, обеспечивающее калиброванную неопределенность при сохранении дифференцируемости для оптимизации в обучении с подкреплением.

📖

термины

Contrôleur Neuronal Différentiable

Réseau neuronal implémentant une politique de contrôle dont les sorties sont des fonctions différentiables des états d'entrée, permettant l'optimisation conjointe avec le modèle de dynamique dans des cadres model-based.

📖

термины

Méthode de Tir Multiple Différentiable

Algorithme de résolution de problèmes aux limites pour les systèmes continus, adapté pour être différentiable et ainsi permettre l'optimisation de paramètres dans les trajectoires d'apprentissage par renforcement.

📖

термины

Modèle d'Espace d'États à Fonctions de Base

Représentation de la dynamique continue où les transitions d'états sont approximées par une combinaison linéaire de fonctions de base différentiables, facilitant l'optimisation analytique des paramètres du modèle.

📖

термины

Optimisation de Politique par Modèle Différentiable (DMPO)

Variante de l'optimisation de politique où les gradients sont calculés à travers un modèle de dynamique différentiable, combinant les avantages des méthodes model-based et model-free pour les environnements continus.

📖

термины

Équation de la Dynamique Apprise (LDE)

Formulation mathématique où les paramètres d'une équation différentielle décrivant la dynamique du système sont appris par optimisation, tout en conservant la structure différentiable de l'équation originale.

📖

термины

Modèle Hybride Continu-Discret Différentiable

Architecture de modélisation combinant des composantes continues différentiables avec des événements discrets, où les transitions sont lissées pour maintenir la différentiabilité globale du système.

📖

термины

Prédiction d'État par Intégration Différentiable

Processus de prédiction des états futurs utilisant une intégration numérique dont l'opération est elle-même différentiable, permettant de calculer les gradients de la prédiction par rapport aux paramètres du modèle.

📖

термины

Réseau de Neurones Physiquement Informé (PINN)

Architecture neuronale qui intègre des équations différentielles issues de la physique dans sa fonction de perte, garantissant que le modèle appris respecte les lois de conservation tout en restant différentiable.

📖

термины

Метод дифференцируемой коллокации

Техника решения задач оптимизации с ограничениями для непрерывных систем, где ограничения коллокации формулируются как дифференцируемые функции для обучения политик.

📖

термины

Модель перехода на основе уравнений Навье-Стокса

Использование уравнений Навье-Стокса, сделанных дифференцируемыми путем подходящей дискретизации, для моделирования динамики жидкостей в средах непрерывного обучения с подкреплением.

📖

термины

Оптимизация с использованием дифференцируемого расширенного лагранжиана

Метод оптимизации с ограничениями, где функция расширенного лагранжиана дифференцируема по переменным состояния и управления, что позволяет использовать ее в циклах обучения с подкреплением.

Глоссарий ИИ

Дифференцируемая модель перехода

Стохастические обыкновенные дифференциальные уравнения (ОДУ)

Дифференцируемый численный интегратор

Нейронная сеть с радиальными базисными функциями (RBF)

Планирование по оптимизированной траектории (TPO)

Моделирование с помощью гамильтоновых систем

Автоматическое дифференцирование во времени

Временная гауссовская модель процесса (TGPM)

Contrôleur Neuronal Différentiable

Méthode de Tir Multiple Différentiable

Modèle d'Espace d'États à Fonctions de Base

Optimisation de Politique par Modèle Différentiable (DMPO)

Équation de la Dynamique Apprise (LDE)

Modèle Hybride Continu-Discret Différentiable

Prédiction d'État par Intégration Différentiable

Réseau de Neurones Physiquement Informé (PINN)

Метод дифференцируемой коллокации

Модель перехода на основе уравнений Навье-Стокса

Оптимизация с использованием дифференцируемого расширенного лагранжиана

Результаты не найдены