AI用語集
人工知能の完全辞典
ストリーム分類
連続的に逐次到着するデータインスタンスに事前定義されたラベルを割り当てるプロセスであり、以前のデータを再訪する可能性はない。この技術は、動的に変化する分布に適応しながらリアルタイムでデータを分類することを可能にする。
ヘフディング木
ヘフディングの不等式を使用してノードを分割するタイミングを決定し、データストリームからモデルを構築する増分決定木アルゴリズム。構築された木がバッチデータで構築されたものと漸近的に同一であり、制御可能な確率で保証される。
データストリームマイニング
連続的かつ潜在的に無限のデータストリームから知識を抽出するためのアルゴリズムと技術の研究分野。これらのアルゴリズムは、限られたメモリと計算リソースでデータを単一パスで処理する必要がある。
増分学習
新しいデータが利用可能になるにつれてモデルを継続的に更新し、完全な再学習を必要としない学習パラダイム。このアプローチは、連続的なデータストリームを持つ動的環境で進化するシステムにとって不可欠である。
概念進化
時間の経過とともにデータストリームで新しいクラスが出現する、概念ドリフトとは異なる現象。概念進化の検出は、ラベルが進化する可能性のある環境で分類モデルの関連性を維持するために重要である。
ストリームのためのアンサンブル手法
データストリーム分類における性能と堅牢性を向上させるために複数の分類器を組み合わせる技術。これらの手法には、適応的バギング、オンラインブースティング、概念ドリフトを効果的に管理するための多様性ベースのアプローチが含まれる。
VFDT(超高速決定木)
ヘフディングの不等式を使用して最小限のインスタンス数で統計的に有効な決定を保証する、データストリーム向けの先駆的な決定木アルゴリズム。多くの現代的なストリーム分類アルゴリズムの基礎を構成する。
ドリフト検出法(DDM)
分類器の誤り率とその変動を監視することで概念ドリフトを検出する統計的手法。二項分布に基づく信頼限界を使用して、モデルの性能が有意に低下するタイミングを特定する。
ストリーム向けK近傍法
kd木やLSHなどの効率的なデータ構造を使用して、ストリームデータに対するKNNアルゴリズムの適応。これらの手法は、データの進化とストリームに固有のメモリ制約を管理しながら、高速な近傍クエリを維持する必要がある。
ストリーム向け単純ベイズ分類器
新しいインスタンスがストリームに到着するにつれて条件付き確率を更新する、単純ベイズ分類器の増分バージョン。このアルゴリズムは計算複雑度が線形であるため、高次元データストリームに特に効果的。
時間減衰関数
ストリーム内の古いインスタンスに減少する重みを割り当てるメカニズムで、最近のデータにより多くの重要性を与える。これらの関数は、モデルを段階的な変化に適応させ、時間的関連性を維持するために不可欠。
リソース認識型ストリームマイニング
システムの制約と負荷に基づいて計算リソースとメモリ使用量を動的に適応させるストリーム分類アプローチ。厳しいリソース制限下でも許容可能な性能を維持できる。
逐次評価
各インスタンスを最初にモデルのテストに使用し、その後トレーニングに使用する、データストリームに特化した評価方法論。このテスト・トレインアプローチは、非定常データに対する現実的な性能測定を提供する。