基于压缩FP-树和数组技术的频繁模式挖掘算法

被引:16
作者
秦亮曦 [1 ]
苏永秀 [2 ]
刘永彬 [1 ]
梁碧珍 [1 ]
机构
[1] 广西大学计算机与电子信息学院
[2] 广西气象减灾研究所
关键词
数据挖掘; 关联规则; 频繁模式; 压缩FP-树;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
FP-growth算法是目前较高效的频繁模式挖掘算法之一.它只需扫描数据库两次,而且不需要产生和测试候选集,避免了这些费时的工作,因此该算法具有较高的效率.然而,FP-growth算法需要递归地生成大量的条件FP-树,这耗费了大量的存储空间和时间.综合已有的几项优势技术,提出了一种频繁模式挖掘算法CFPmine.一是采用了基于压缩FP-树的约束子树的挖掘方法,避免在挖掘过程中生成条件FP-树,减少内存占用;二是采用基于数组的技术,减少FP-树的遍历时间,提高算法的效率.另外,在算法中还实现了统一的内存管理.实验结果表明,CFPmine是一个高效的频繁模式挖掘算法,其性能优于Apriori,Eclat和FP-growth算法,而需要的内存却少于FP-growth算法.
引用
收藏
页码:244 / 249
页数:6
相关论文
共 1 条
[1]   在FP-树中挖掘频繁模式而不生成条件FP-树 [J].
范明 ;
李川 ;
不详 .
计算机研究与发展 , 2003, (08) :1216-1222