BERT(Bidirectional Encoder Representations)
BERT-base vs BERT-large
BERTの2つの主要な設定:base(12層、768隠れ次元、1.1億パラメータ)とlarge(24層、1024次元、3.4億パラメータ)で、異なる性能/リソースのトレードオフに対応します。
← 戻るBERTの2つの主要な設定:base(12層、768隠れ次元、1.1億パラメータ)とlarge(24層、1024次元、3.4億パラメータ)で、異なる性能/リソースのトレードオフに対応します。
← 戻る