🏠 Trang chủ
Benchmark
📊 Tất cả benchmark 🦖 Khủng long v1 🦖 Khủng long v2 ✅ Ứng dụng To-Do List 🎨 Trang tự do sáng tạo 🎯 FSACB - Trình diễn cuối cùng 🌍 Benchmark dịch thuật
Mô hình
🏆 Top 10 mô hình 🆓 Mô hình miễn phí 📋 Tất cả mô hình ⚙️ Kilo Code
Tài nguyên
💬 Thư viện prompt 📖 Thuật ngữ AI 🔗 Liên kết hữu ích

Thuật ngữ AI

Từ điển đầy đủ về Trí tuệ nhân tạo

162
danh mục
2.032
danh mục con
23.060
thuật ngữ
📖
thuật ngữ

Modality Alignment

Processus d'entraînement visant à aligner les espaces de représentation de différentes modalités dans un espace vectoriel commun pour faciliter les transferts cross-modaux.

📖
thuật ngữ

Perceiver

Architecture Transformer généraliste capable de traiter des données arbitraires multimodales en utilisant un mécanisme d'attention cross-attention entre entrées et bottleneck latent.

📖
thuật ngữ

Unified Multimodal Pre-training

Approche pré-entraînant un seul modèle sur multiples tâches et modalités simultanément pour obtenir des représentations plus générales et transférables.

📖
thuật ngữ

Image Captioning Transformer

Architecture encoder-décodeur Transformer générant automatiquement des descriptions textuelles descriptives et cohérentes pour des images d'entrée.

📖
thuật ngữ

Audio-Visual Transformer

Modèle Transformer traitant simultanément les flux audio et vidéo pour des tâches comme la reconnaissance audiovisuelle ou la génération synchronisée.

📖
thuật ngữ

Video Transformer

Variante de Vision Transformer adaptée au traitement séquentiel des frames vidéo incorporant des informations temporelles via l'attention spatio-temporelle.

📖
thuật ngữ

Transformer-based Multimodal Fusion

Technique utilisant les mécanismes d'attention des Transformers pour fusionner intelligemment les caractéristiques de multiples modalités au niveau sémantique.

🔍

Không tìm thấy kết quả