海量信息异常检测问题的异常概率排序算法

被引:6
作者
陈刚 [1 ]
蔡远利 [1 ]
穆静 [1 ]
杨卫丽 [2 ]
机构
[1] 西安交通大学电子与信息工程学院
[2] 中国国防科技信息中心
关键词
数据挖掘; 异常检测; 均匀分割; 异常概率排序;
D O I
暂无
中图分类号
TP393.08 [];
学科分类号
0839 ; 1402 ;
摘要
针对异常检测算法速度慢、精度低、稳定性差等问题,提出了一种通过异常概率排序提取异常点的算法(OAP).由于异常点相对正常点更容易通过对数据空间的均匀分割而孤立出来,所以OAP通过数据点在均匀N叉分割树中的孤立深度估算异常概率的大小,从而得到异常概率的排序,最终构造由k个异常概率最大的点组成的列表,列表中的数据就是所求的异常点.OAP不需要距离或密度的计算,复杂度被降到O(n)级.实验结果表明,对于规模线性增加的海量实验数据集,OAP消耗的CPU时间也线性增加;相对iForest算法,其速度提高了30倍,精度提高了20%~30%,且同一数据集上的多次实验结果一致,稳定性高.
引用
收藏
页码:36 / 40
页数:5
相关论文
共 3 条
[1]   A brain tumor segmentation framework based on outlier detection [J].
Prastawa, M ;
Bullitt, E ;
Ho, S ;
Gerig, G .
MEDICAL IMAGE ANALYSIS, 2004, 8 (03) :275-283
[2]  
Ordinal optimization of DEDS.[J].Y. C. Ho;R. S. Sreenivas;P. Vakili.Discrete Event Dynamic Systems.1992, 1
[3]  
离散数学.[M].祝颂和等编;.西安交通大学出版社.1991,