AI用語集
人工知能の完全辞典
K分割交差検証
データセットをK個の等しい分割に分け、各分割が順番にテストセットとして使用され、残りのK-1個が訓練セットとして使用されるモデル評価手法。この方法により、評価の分散を減らし、モデル性能のより頑健な推定が可能となる。
層化K分割交差検証
各分割でクラスの分布を維持するK-Foldの変種で、不均衡なデータセットに不可欠。このアプローチにより、各フォールドが元のデータセットの全体的なクラス分布を忠実に反映することが保証される。
ホールドアウト法
データセットを訓練セットとテストセットの2つの別々の集合に分割するシンプルな評価手法で、通常70/30または80/20の比率が使用される。実装が迅速である一方、データの分割方法によっては性能評価に偏りが生じる可能性がある。
反復交差検証
異なるランダム分割でK-Foldプロセスを複数回繰り返し、性能推定の分散を減らす手法。このアプローチはK-Foldの利点と、計算コストの増加と引き換えに得られるより高い統計的頑健性を組み合わせたもの。
ブートストラップ検証
元データからの復元抽出を使用して複数の訓練セットとテストセットを作成する評価手法。ブートストラップはモデル性能の分散を推定でき、特に小規模なデータセットで有用である。
グリッドサーチと交差検証
指定されたすべてのハイパーパラメータの組み合わせを網羅的にテストし、各設定を交差検証で評価する体系的な最適化手法。この方法では定義されたグリッド内で最良の組み合わせを見つけることが保証されるが、計算コストが非常に高くなる可能性がある。
ランダムサーチと交差検証
すべての可能性を網羅的に探索する代わりに、固定数のハイパーパラメータの組み合わせをランダムにサンプリングするGrid Searchの代替手法。このアプローチは、Grid Searchよりも少ない評価回数で良好なハイパーパラメータを見つけることがしばしばより効率的である。
学習曲線
訓練セットのサイズに対するモデル性能の変化を示すグラフで、過学習または学習不足の診断に使用される。学習曲線は、追加のデータがモデル性能を改善するかどうかを判断するのに役立つ。
検証曲線
単一のハイパーパラメータが学習と検証の性能に与える影響を視覚化する診断ツール。検証曲線は最適なハイパーパラメータ値を特定し、バイアスと分散の問題を検出することを可能にする。
交差エントロピー
2つの確率分布間の差異を測定する損失関数で、分類問題で広く使用される。交差エントロピーは、予測が間違っているほど、かつ確信度が高いほど大きなペナルティを与えるため、優れた学習指標となる。
平均二乗誤差
予測値と実測値の差の二乗平均を計算する評価指標で、大きな誤差に特に敏感。MSEは回帰問題で一般的に使用され、MAEよりも大きな誤差をより強く罰する。
平均絶対誤差
予測値と実測値の誤差の絶対値の平均を測定する回帰指標で、ターゲット変数の単位で直接解釈できる。MSEとは異なり、MAEは外れ値の影響を受けにくく、平均絶対誤差を表す。
R²スコア
モデルによって説明されるターゲット変数の分散の割合を測定する決定係数で、-∞から1の範囲を取る。R²が1の場合は完全な予測を示し、負の値はモデルが単純な平均よりも性能が低いことを示唆する。
F1スコア
適合率と再現率の調和平均を計算する分類指標で、不均衡なデータセットで特に有用。F1スコアは、モデルが偽陽性と偽陰性を回避する能力を単一の測定値でバランスよく評価する。
適合率-再現率曲線
様々な分類閾値における適合率と再現率のトレードオフを示すグラフで、不均衡データ上のモデル評価に不可欠。この曲線下面積(AUC-PR)は閾値に依存しない集約的性能指標を提供する。
ROC曲線
様々な決定閾値における真陽性率と偽陽性率の関係を表す曲線で、モデルの識別能力を視覚化する。ROC曲線とその曲線下面積(AUC-ROC)は、二値分類器の全体的な性能評価の標準となっている。
AUCスコア
ランダムに選ばれた正例が負例よりも高いスコアを得る確率を測定するROC曲線下面積。AUCは閾値に依存しない性能指標を提供し、特に異なるモデルを比較する際に有用です。
グループK分割交差検証
同じグループが異なる訓練セットとテストセットに同時に現れないことを保証するK分割の変形手法。このアプローチは、データにグループ構造(患者、ユーザーなど)があり、同じグループ内の観測値が相関している場合に重要です。