挖掘数据流任意滑动时间窗口内频繁模式

被引:42
作者
李国徽
陈辉
机构
[1] 华中科技大学计算机科学与技术学院
关键词
数据流; 频繁模式挖掘; 滑动时间窗口; 时间衰减模型;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
由于数据流的流动性与连续性,数据流所蕴含的知识会随着时间的推移而发生变化.因此,在绝大多数数据流的应用中,用户往往对新产生的流数据所包含的知识要比对历史流数据所包含的知识感兴趣得多.提出了一种挖掘数据流任意大小滑动时间窗口内频繁模式的方法MSW(mining sliding window).当数据流流过时,该方法使用滑动窗口树SW-tree在单遍扫描流数据的条件下及时捕获数据流上最新的模式信息.同时,该方法还周期性地删除滑动窗口树上过期的及不频繁的模式分支,从而降低滑动窗口树的空间复杂度与维护代价.此外,该方法还应用时间衰减模型逐步降低历史事务模式支持数的权重,并由此来区分最近产生事务与历史事务的模式.大量仿真实验的结果表明,算法MSS具有较高的效率与优良的可扩展性,同时也优于其他同类算法.
引用
收藏
页码:2585 / 2596
页数:12
相关论文
共 3 条
[1]   Research issues in data stream association rule mining [J].
Jiang, N ;
Gruenwald, L .
SIGMOD RECORD, 2006, 35 (01) :14-19
[2]   Mining top-K frequent itemsets from data streams [J].
Wong, Raymond Chi-Wing ;
Fu, Ada Wai-Chee .
DATA MINING AND KNOWLEDGE DISCOVERY, 2006, 13 (02) :193-217
[3]  
Mining data streams[J] . Mohamed Medhat Gaber,Arkady Zaslavsky,Shonali Krishnaswamy.ACM SIGMOD Record . 2005 (2)