基于距离的数据流在线检测算法研究

被引:6
作者
李少波 [1 ,2 ]
魏中贺 [3 ]
孟伟 [2 ]
机构
[1] 贵州大学现代制造技术教育部重点实验室
[2] 中国科学院成都计算机研究所
[3] 贵州大学计算机科学与技术学院
关键词
数据流; 滑动窗口; k-距离; 异常检测; 信息熵;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对传统的数据流检测中存在的时间复杂度高、准确度低等问题,提出了一种基于滑动时间窗口和k-距离剪枝的信息熵异常检测算法。该算法引用滑动时间窗口将动态的数据流静态化,当数据流填满当前窗口后,在当前窗口中用k-距离剪枝方法对数据进行初步检测,从而剔除绝大部分的正常数据。最后再对筛选出疑似异常的数据用信息熵的检测方法进行检测,输出信息熵值大于设定阈值EA的数据点。通过实验验证,该算法比传统的检测算法在时间复杂度和准确度上都有一定的优越性。
引用
收藏
页码:3579 / 3581
页数:3
相关论文
共 14 条
[1]   IncLOF:动态环境下局部异常的增量挖掘算法 [J].
杨风召 ;
朱扬勇 ;
施伯乐 .
计算机研究与发展, 2004, (03) :477-484
[2]   Efficient clustering of uncertain data streams [J].
Jin, Cheqing ;
Yu, Jeffrey Xu ;
Zhou, Aoying ;
Cao, Feng .
KNOWLEDGE AND INFORMATION SYSTEMS, 2014, 40 (03) :509-539
[3]  
Distance-based outliers: algorithms and applications[J] . Edwin M. Knorr,Raymond T. Ng,Vladimir Tucakov. &nbspThe VLDB Journal . 2000 (3-4)
[4]  
LOF: identifying density-based local outliers. Breunig M M, Kreigel H P, Ng R T, et al. Proceedings of the 2000 ACM SIGMOD International Conference on Management of Data . 2000
[5]  
Adensity grid-based uncertain data stream clustering algorithm. He Haitao,Zhao Jintian. Journal of Computational Information Systems . 2014
[6]   分布式密度和中心点数据流聚类算法的研究 [J].
高宏宾 ;
侯杰 ;
刘劲飞 .
计算机应用与软件, 2013, 30 (10) :181-184
[7]   基于密度与近邻传播的数据流聚类算法 [J].
张建朋 ;
陈福才 ;
李邵梅 ;
刘力雄 .
自动化学报, 2014, 40 (02) :277-288
[8]   基于交叠数据窗距离测度概念漂移检测新方法 [J].
刘茂 ;
张东波 ;
赵圆圆 .
计算机应用, 2014, 34 (02) :542-545+549
[9]   一种基于区域划分的数据流子空间聚类方法 [J].
于翔 ;
印桂生 ;
许宪东 ;
王建伟 .
计算机研究与发展, 2014, (01) :88-95
[10]   基于距离的数据流离群点快速检测 [J].
赵学良 ;
朱庆生 .
世界科技研究与发展, 2013, 35 (04) :462-464+480