Diffusion Vidéo et Temporelle
Attention 3D
Mécanisme d'attention qui traite simultanément les dimensions spatiales (hauteur, largeur) et temporelle (temps) d'une vidéo, permettant au modèle de pondérer l'importance de différentes régions à travers différents moments pour capturer les dépendances spatio-temporelles.
← Retour