面向数据流的频繁项集挖掘研究

被引:5
作者
孟彩霞
机构
[1] 西安邮电学院计算机科学系
关键词
数据流; 数据挖掘; 数据流挖掘; 频繁项集;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
针对数据流的特点,对数据流中频繁模式挖掘问题进行了研究,提出了数据流频繁项集挖掘算法FP-SegCount。该算法将数据流分段并利用改进的FP-growth算法挖掘分段中的频繁项集。然后,利用Count Min Sketch进行项集计数。算法解决了压缩统计和计算快速高效的问题。通过和FP-DS算法的实验对比,FP-SegCount算法具有较好的时间效率。
引用
收藏
页码:138 / 140+159 +159
页数:4
相关论文
共 3 条
[1]
数据流频繁模式挖掘算法设计 [J].
敖富江 ;
颜跃进 ;
黄健 ;
黄柯棣 .
计算机科学, 2008, (03) :1-5
[2]
数据流频繁模式挖掘研究进展 [J].
潘云鹤 ;
王金龙 ;
徐从富 .
自动化学报, 2006, (04) :594-602
[3]
挖掘数据流中的频繁模式 [J].
刘学军 ;
徐宏炳 ;
董逸生 ;
王永利 ;
钱江波 .
计算机研究与发展, 2005, (12) :2192-2198