GDLOF:基于网格和稠密单元的快速局部离群点探测算法

被引:6
作者
张净
孙志挥
机构
[1] 东南大学计算机科学与工程系
基金
高等学校博士学科点专项科研基金;
关键词
数据挖掘; 离群点; 稠密单元; 稠密区域;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
为了适应高维大规模数据集的稀疏性,解决现有离群点探测算法在运用于高维大规模数据集时计算量以及时间效率均无法令人满意的现状,区别于以往文献中以点的数量作为判断稠密的阈值,在基于密度的局部异常检测算法LOF的基础上,以通过数据集中每一点周围的邻近点的状况作为判别依据,提出了稠密单元和稠密区域的概念以及基于网格和稠密单元的快速局部离群点探测算法.通过证明稠密单元和稠密区域中的点不可能成为离群点,使得算法减少了LOF值的计算量并显著提高效率.实验表明,该算法对于高维大规模数据集具有良好的适用性和有效性.
引用
收藏
页码:863 / 866
页数:4
相关论文
共 3 条
[1]   GridOF:面向大规模数据集的高效离群点检测算法 [J].
李存华 ;
孙志挥 .
计算机研究与发展, 2003, (11) :1586-1592
[2]   高维空间中的离群点发现 [J].
魏藜 ;
宫学庆 ;
钱卫宁 ;
周傲英 .
软件学报, 2002, (02) :280-290
[3]  
Distance-based outliers: algorithms and applications[J] . Edwin M. Knorr,Raymond T. Ng,Vladimir Tucakov.The VLDB Journal . 2000 (3-4)