基于Topology模型的数据流频繁闭项集挖掘

被引:2
作者
许晓
王诚
机构
[1] 南京邮电大学通信与信息工程学院
关键词
Topology; Moment算法; 数据流; 基础窗口; 频繁闭项集;
D O I
10.14132/j.cnki.1673-5439.2016.03.012
中图分类号
TP311.13 [];
学科分类号
摘要
针对数据流频繁闭项集挖掘算法Moment存在的缺点和不足,提出一种改进算法——TP-Moment。该算法利用Topology模型处理整个挖掘过程,将滑动窗口分为若干个基础窗口,用基础窗口更新取代增量式更新。通过并行化的挖掘每个基础窗口中的临界频繁闭项集合,存储到一种可动态更新的树结构GCFI-tree中,快速挖掘滑动窗口中所有全局频繁闭项集并存储。实验证明,改进算法在保证挖掘结果的同时,有效地降低了挖掘时间和内存空间。
引用
收藏
页码:79 / 84
页数:6
相关论文
共 6 条
[1]
基于Storm的实时计算框架的研究与应用 [J].
李川 ;
鄂海红 ;
宋美娜 .
软件, 2014, 35 (10) :16-20
[2]
一种基于Storm编程模型的迭代Topology方案 [J].
杜政颉 ;
王鹏 ;
黄焱 ;
郎福通 .
成都信息工程学院学报, 2014, 29 (01) :47-51
[3]
基于滑动窗口的数据流闭合频繁模式的挖掘 [J].
刘学军 ;
徐宏炳 ;
董逸生 ;
钱江波 ;
王永利 .
计算机研究与发展, 2006, (10) :1738-1743
[4]
Mining frequent closed itemsets from a landmark window over online data streams.[J].Xuejun Liu;Jihong Guan;Ping Hu.Computers and Mathematics with Applications.2008, 6
[5]
Finding frequent items in data streams.[J].Moses Charikar;Kevin Chen;Martin Farach-Colton.Theoretical Computer Science.2003, 1
[6]
数据流频繁闭项集挖掘算法研究 [D]. 
赖胜 .
兰州理工大学,
2011