AI用語集
人工知能の完全辞典
ガウス混合モデル
多次元ガウス分布の線形結合としてデータセットをモデル化する確率的アプローチで、データ内のサブグループを特定することを可能にする。
EMアルゴリズム
潜在変数を含むモデルにおいて尤度を最大化するパラメータ推定のための反復的手法で、期待ステップと最大化ステップを交互に行う。
Eステップ(期待値ステップ)
現在のパラメータに基づき、各観測値が混合モデルの各コンポーネントに属する事後確率を計算するEMアルゴリズムの段階。
Mステップ(最大化ステップ)
期待対数尤度を最大化するために、モデルのパラメータ(平均、共分散、混合係数)を更新するEMアルゴリズムの段階。
混合パラメータ
GMMを定義するパラメータの集合で、各ガウス成分の平均、共分散行列、混合係数を含む。
混合係数
混合モデルの各ガウス成分に関連付けられた重みで、観測値がその成分に属する事前確率を表す。
責任行列
EMアルゴリズムのEステップで計算される、各観測値が各クラスタに属する確率を含む行列。
ソフトクラスタリング
ハードクラスタリングとは異なり、各観測値が異なる所属度で複数のクラスタに属することができるクラスタリングアプローチ。
AIC基準
データへの適合度と複雑性をバランスさせることでモデルの品質を評価し、最適なコンポーネント数を選択するために使用される赤池情報量基準。
BIC基準
AICよりもモデルの複雑性をより強くペナルティし、より単純なモデルを好むベイズ情報量基準。
K-means初期化
最初にK-meansアルゴリズムを使用してクラスタ中心の初期推定値を取得することで、GMMパラメータを初期化する手法。
確率密度
GMM内のガウス成分によってモデル化される、連続値を観測する相対的な確率を記述する関数。
EMアルゴリズムの収束
連続する反復間の対数尤度の変動が事前に定義された閾値以下になった場合に基づくEMアルゴリズムの停止基準。
信頼楕円
多変量ガウス分布に対して特定の確率パーセンテージを含む領域のグラフィカル表現。
クラスタの分離性
得られるセグメンテーションの品質に影響を与える、混合モデル内の異なるガウス成分間の重複度の測定。