Tokenization Subword
Cobertura del vocabulario
Métrica que evalúa la proporción del corpus que puede ser representada sin tokens UNK, optimizada por algoritmos subword para alcanzar típicamente más del 99.9% de cobertura en los corpus modernos.
← Volver