数据流中频繁闭项集的近似挖掘算法

被引:12
作者
刘旭
毛国君
孙岳
刘椿年
机构
[1] 北京工业大学计算机学院北京市多媒体与智能软件重点实验室
基金
国家自然科学基金重大项目;
关键词
数据挖掘; 数据流; 频繁闭项集;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
在数据流中挖掘频繁项集得到了广泛的研究,传统的研究方法大多关注于在数据流中挖掘全部频繁项集.由于挖掘全部频繁项集存在数据和模式冗余问题,所以对算法的时间和空间效率都具有更大的挑战性.因此,近年来人们开始关注在数据流中挖掘频繁闭项集,其中一个典型的工作就是Moment算法.本文提出了一种数据流中频繁闭项集的近似挖掘算法A-Moment.它采用衰减窗口机制、近似计数估计方法和分布式更新信息策略来解决Moment算法中过度依赖于窗口和执行效率低等问题.实验表明,该算法在保证挖掘精度的前提下,可以比Moment获得更好的效率.
引用
收藏
页码:900 / 905
页数:6
相关论文
共 2 条
[1]   挖掘闭合模式的高性能算法 [J].
刘君强 ;
孙晓莹 ;
庄越挺 ;
潘云鹤 .
软件学报, 2004, (01) :94-102
[2]  
Mining frequent item-sets over arbitrarytimeintervals in data streams .2 Giannella C,Han J,Robertson E,Liu C. . 2003