基于兴趣度的数据流频繁模式散列挖掘算法

被引:4
作者
琚春华 [1 ,2 ]
殷贤君 [2 ]
机构
[1] 浙江工商大学计算机与信息工程学院
[2] 浙江工商大学现代商贸中心
基金
高等学校博士学科点专项科研基金; 浙江省自然科学基金;
关键词
数据流; 频繁模式; 兴趣度; MIFS-HT;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
频繁模式挖掘是很多数据流挖掘工作的基础.现有算法虽然能够有效的在数据流中挖掘近似的频繁模式,但是由于数据流数据的不确定性、连续性以及海量性,始终不能有效的将算法的时间效率和空间效率控制在一个可以接受的范围内.本文通过使用散列表作为概要数据的存储结构,并引入关联规则兴趣度的概念,提出了数据流频繁模式挖掘算法MIFS-HT(mining interesting frequent itemsets with hash table),不仅有效降低现有算法的时空复杂度,同时提高了算法的应用价值.最后,实验结果表明:MIFS-HT是一种高效的数据流频繁模式挖掘算法,其性能优于FPStream、LossyCounting等算法,并且挖掘结果更具有现实意义.
引用
收藏
页码:2764 / 2773
页数:10
相关论文
共 9 条
[1]   数据流中基于矩阵的频繁项集挖掘 [J].
王磊 ;
黄志球 ;
朱小栋 ;
沈国华 ;
程亮 .
计算机科学与探索, 2008, (03) :330-336
[2]   一个基于兴趣度的关联规则采掘算法 [J].
周皓峰 ;
朱扬勇 ;
施伯乐 .
计算机研究与发展, 2002, (04) :450-457
[3]   关联规则挖掘综述 [J].
蔡伟杰 ;
张晓辉 ;
朱建秋 ;
朱扬勇 .
计算机工程, 2001, (05) :31-33+49
[4]   挖掘所关注规则的多策略方法研究 [J].
程继华 ;
郭建生 ;
施鹏飞 .
计算机学报, 2000, (01) :47-51
[5]   采掘关联规则的高效并行算法 [J].
铁治欣 ;
陈奇 ;
俞瑞钊 .
计算机研究与发展, 1999, (08) :53-58
[6]   Research issues in data stream association rule mining [J].
Jiang, N ;
Gruenwald, L .
SIGMOD RECORD, 2006, 35 (01) :14-19
[7]  
Mining data streams[J] . Mohamed Medhat Gaber,Arkady Zaslavsky,Shonali Krishnaswamy. ACM SIGMOD Record . 2005 (2)
[8]   Simulation data as data streams [J].
Abdulla, G ;
Critchlow, T ;
Arrighi, W .
SIGMOD RECORD, 2004, 33 (01) :89-94
[9]  
Estimation and maintenance of frequent pattern in data streams .2 Song Guo jie,Wang Tengjiao,Tang Shiwei,et al. National Data Base Conf 2003 . 2003