GridOF:面向大规模数据集的高效离群点检测算法

被引:25
作者
李存华
孙志挥
机构
[1] 东南大学计算机科学与工程系
[2] 东南大学计算机科学与工程系 南京 淮海工学院计算机科学系 连云港
[3] 南京
关键词
离群点检测; 修正近似; GidOF算法;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
作为数据库知识发现研究的重要技术手段,现有离群点检测算法在运用于大型数据集时其时间与空间效率均无法令人满意.通过对数据集中离群点分布特征的分析,在数据空间网格划分的基础上,研究数据超方格层次上的密度近似计算与稠密数据主体滤除策略.给出通过简单的修正近似计算取代繁复的点对点密度函数值计算的方法.基于上述思想构造的离群点检测算法GridOF在保持足够检测精度的同时显著降低了时空复杂度,运用于大规模数据集离群点检测具有良好的适用性和有效性.
引用
收藏
页码:1586 / 1592
页数:7
相关论文
共 1 条
[1]  
The Design and Analysis of Spatial Data Structures .2 H Samet. Boston, MA: Addison-Wesley . 1990