Computação de Precisão Mista
Aceleração por Esparsidade
Técnica combinada com mixed precision que explora os zeros em tensores para pular cálculos desnecessários, reduzindo a largura de banda da memória e aumentando o throughput efetivo das operações matriciais.
← Voltar