組み込みAutoMLとエッジ
モデル量子化
ニューラルネットワークの重みと活性化の数値精度(通常32ビットから8ビット以下に)を削減し、モデルサイズを縮小し、制約のあるハードウェアでの推論を高速化する最適化手法。
← 戻るニューラルネットワークの重みと活性化の数値精度(通常32ビットから8ビット以下に)を削減し、モデルサイズを縮小し、制約のあるハードウェアでの推論を高速化する最適化手法。
← 戻る