Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Apprentissage par Dyna-Q
Algorithme hybride combinant apprentissage direct et planification utilisant un modèle appris pour générer des expériences simulées.
Planification Monte Carlo Tree Search
Algorithme d'exploration d'arbre de décision utilisant des simulations aléatoires pour évaluer les actions futures dans un environnement modélisé.
Apprentissage par Imagination
Technique utilisant des modèles internes pour simuler mentalement des scénarios et accélérer l'apprentissage sans interaction réelle.
World Models
Architecture apprenant une représentation compressée de l'environnement et un modèle de transition pour la planification dans un espace latent.
Apprentissage par Ensemble de Modèles
Approche utilisant plusieurs modèles appris pour quantifier l'incertitude et améliorer la robustesse des décisions.
Apprentissage par Différentiation de Modèles
Méthode optimisant directement les politiques en faisant passer les gradients à travers un modèle différentiable de l'environnement.
Apprentissage par Curiosité Model-Based
Système utilisant les erreurs de prédiction du modèle comme signal intrinsèque pour guider l'exploration de l'environnement.
Apprentissage par Hiérarchie Model-Based
Structure multi-niveaux combinant des modèles à différentes échelles temporelles pour une planification efficace sur des horizons longs.
Apprentissage par Prédiction de Trajectoires
Modèles prédictifs apprenant à anticiper les séquences d'états futurs pour évaluer les conséquences des actions avant exécution.
Apprentissage par Transfer Learning Model-Based
Technique transférant les connaissances du modèle entre environnements similaires pour accélérer l'adaptation à de nouvelles tâches.
MuZero
Algorithme avancé apprenant simultanément un modèle de transition, de réaction et de valeur sans connaissance préalable de la dynamique.
Apprentissage par Apprentissage Actif
Stratégie sélectionnant activement les expériences les plus informatives pour améliorer l'efficacité d'apprentissage du modèle.