高维类别属性数据流离群点快速检测算法

被引:21
作者
周晓云
孙志挥
张柏礼
杨宜东
机构
[1] 东南大学计算机科学与工程系
关键词
数据流; 离群点检测; 频繁模式; 高维; 概念转移;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
提出类别属性数据流数据离群度量——加权频繁模式离群因子(weighted frequent pattern outlier factor,简称WFPOF),并在此基础上给出一种快速数据流离群点检测算法FODFP-Stream(fast outlier detection for high dimensional categorical data streams based on frequent pattern).该算法通过动态发现和维护频繁模式来计算离群度,能够有效地处理高维类别属性数据流,并可进一步扩展到数值属性和混合属性数据流.对仿真数据集和真实数据集的实验检测均验证该算法具有良好的适用性和有效性.
引用
收藏
页码:933 / 942
页数:10
相关论文
共 4 条
[1]   流数据分析与管理综述 [J].
金澈清 ;
钱卫宁 ;
周傲英 .
软件学报, 2004, (08) :1172-1181
[2]   GridOF:面向大规模数据集的高效离群点检测算法 [J].
李存华 ;
孙志挥 .
计算机研究与发展, 2003, (11) :1586-1592
[3]   高维空间中的离群点发现 [J].
魏藜 ;
宫学庆 ;
钱卫宁 ;
周傲英 .
软件学报, 2002, (02) :280-290
[4]   An effective and efficient algorithm for high-dimensional outlier detection [J].
Aggarwal, CC ;
Yu, PS .
VLDB JOURNAL, 2005, 14 (02) :211-221