基于动态网格的数据流离群点快速检测算法

被引:20
作者
杨宜东 [1 ]
孙志挥 [1 ]
朱玉全 [2 ]
杨明 [3 ]
张柏礼 [1 ]
机构
[1] 东南大学计算机科学与工程系
[2] 江苏大学计算机科学与通信工程学院
[3] 南京师范大学计算机科学系
关键词
数据流; 离群点检测; 时间相关动态网格划分;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
离群点检测问题作为数据挖掘的一个重要任务,在众多领域中得到了应用.近年来,基于数据流数据的挖掘算法研究受到越来越多的重视.为了解决数据流数据中的离群点检测问题,提出了一种基于数据空间动态网格划分的快速数据流离群点检测算法.算法利用动态网格对空间中的稠密和稀疏区域进行划分,过滤处于稠密区域的大量主体数据,有效地减少了算法所需考察的数据对象的规模.而对于稀疏区域中的候选离群点,采用近似方法计算其离群度,具有高离群度的数据作为离群点输出.在保证一定精确度的条件下,算法的运行效率可以得到大幅度提高.对模拟数据集和真实数据集的实验检测均验证了该算法具有良好的适用性和有效性.
引用
收藏
页码:1796 / 1803
页数:8
相关论文
共 2 条
[1]   GridOF:面向大规模数据集的高效离群点检测算法 [J].
李存华 ;
孙志挥 .
计算机研究与发展, 2003, (11) :1586-1592
[2]  
Dantong Yu,Gholamhosein Sheikholeslami,Aidong Zhang.<Emphasis Type="Italic">FindOut: Finding Outliers in Very Large Datasets[J].Knowledge and Information Systems,2002