Transformadores de Visión (ViT)
Patch Embedding
Proceso de conversión de los parches de imágenes en vectores de embeddings de dimensión fija mediante proyección lineal para alimentar el Transformer.
← Volver