AI 詞彙表
人工智能完整詞典
200
類別
2,608
子類別
30,011
術語
術語
路径长度
在隔离树中,从根到叶隔离特定数据点所需的分割次数。较短的路径长度表示可能异常的观测值。
術語
森林构建
使用训练数据的不同随机子样本创建多个独立隔离树的过程。性能随树的数量增加而提高,直到达到某个阈值。
術語
平均路径长度
数据点在隔离森林中所有树的路径长度的平均值。作为计算观测值最终异常分数的基础。
術語
异常评分函数
将平均路径长度转换为标准化分数的数学公式,考虑样本大小和树的理论结构。产生异常的概率解释。
術語
iTree
Isolation Tree的缩写,指隔离森林中的单个树。每个iTree都在随机子样本上构建,并使用随机分割来隔离观测值。
術語
子采样大小
构建森林中每个单独树所使用的观测值数量,通常出于统计性能原因固定为256。影响计算效率和检测质量之间的平衡。
術語
异常值检测
识别数据集中显著偏离预期正常行为的观测值的过程。隔离森林通过其基于结构的隔离方法在此任务上表现出色。
術語
无监督异常检测
无需训练标签即可识别异常的机器学习方法,仅基于数据的内在分布。隔离森林是这种方法的典范示例。
術語
树的高度
从根节点到任意叶节点的路径最大长度。异常倾向于在树高度较小的情况下被隔离在更接近根节点的叶子中。
術語
随机分区
使用随机分割而不进行特定优化的树构建策略,与传统决策树不同。这种简单性使算法能够快速有效地隔离异常。
🔍