基于距离的数据流离群点挖掘算法

被引:3
作者
杨显飞
张健沛
杨静
初妍
机构
[1] 哈尔滨工程大学计算机科学与技术学院
关键词
数据流; 离群点; Hoeffding定理; 滑动窗口;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
传统的离群点挖掘算法无法有效挖掘数据流中的离群点。针对数据流的无限输入和动态变化等特点,提出一种新的基于距离的数据流离群点挖掘算法。通过Hoeffding定理及独立同分布中心极限定理,对数据流概率分布变化进行动态检测,利用检测结果自适应调整滑动窗口大小对数据流离群点进行挖掘。实验结果表明,该算法在人工数据集和真实数据集KDD-CUP99中可以对数据流中的离群点进行有效挖掘。
引用
收藏
页码:2949 / 2951+2973 +2973
页数:4
相关论文
共 2 条
[1]   基于直推式方法的网络异常检测方法 [J].
李洋 ;
方滨兴 ;
郭莉 ;
陈友 .
软件学报, 2007, (10) :2595-2604
[2]   高维类别属性数据流离群点快速检测算法 [J].
周晓云 ;
孙志挥 ;
张柏礼 ;
杨宜东 .
软件学报, 2007, (04) :933-942