Codificación posicional
Sesgo de Posición Relativa de T5
Implementación específica de sesgo de posición relativa utilizada en el modelo T5, donde se aprenden los sesgos para diferentes distancias relativas entre los tokens en las puntuaciones de atención.
← Volver