基于局部密度的快速离群点检测算法

被引:64
作者
邹云峰 [1 ]
张昕 [1 ]
宋世渊 [2 ]
倪巍伟 [2 ]
机构
[1] 国网江苏省电力公司电力科学研究院
[2] 东南大学计算机科学与工程学院
关键词
离群点检测; 局部密度; 强k近邻点; 弱k近邻点; 反向k近邻点集;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
已有的密度离群点检测算法LOF不能适应数据分布异常情况离群点检测,INFLO算法虽引入反向k近邻点集有效地解决了数据分布异常情况的离群点检测问题,但存在需要对所有数据点不加区分地分析其k近邻和反向k近邻点集导致的效率降低问题。针对该问题,提出局部密度离群点检测算法——LDBO,引入强k近邻点和弱k近邻点概念,通过分析邻近数据点的离群相关性,对数据点区别对待;并提出数据点离群性预判断策略,尽可能避免不必要的反向k近邻分析,有效提高数据分布异常情况离群点检测算法的效率。理论分析和实验结果表明,LDBO算法效率优于INFLO,算法是有效可行的。
引用
收藏
页码:2932 / 2937
页数:6
相关论文
共 7 条
[1]
异质网中基于张量表示的动态离群点检测方法 [J].
刘露 ;
左万利 ;
彭涛 .
计算机研究与发展, 2016, 53 (08) :1729-1739
[2]
基于聚类和拟合的QAR数据离群点检测算法 [J].
杨慧 ;
王丽婧 .
计算机工程与设计, 2015, 36 (01) :174-177
[3]
半监督的移动对象离群轨迹检测算法 [J].
黄添强 ;
余养强 ;
郭躬德 ;
秦小麟 .
计算机研究与发展, 2011, 48 (11) :2074-2082
[4]
一种基于密度的局部离群点检测算法DLOF [J].
胡彩平 ;
秦小麟 .
计算机研究与发展, 2010, 47 (12) :2110-2116
[5]
基于局部信息熵的加权子空间离群点检测算法 [J].
倪巍伟 ;
陈耿 ;
陆介平 ;
吴英杰 ;
孙志挥 .
计算机研究与发展, 2008, (07) :1189-1194
[6]
Outlier detection for high dimensional data [J].
Aggarwal, CC ;
Yu, PS .
SIGMOD RECORD, 2001, 30 (02) :37-46
[7]
LOF.[J].Markus M. Breunig;Hans-Peter Kriegel;Raymond T. Ng;Jörg Sander.ACM SIGMOD Record.2000, 2