共 1 条
基于压缩FP-树和数组技术的频繁模式挖掘算法
被引:16
作者:
秦亮曦
[1
]
苏永秀
[2
]
刘永彬
[1
]
梁碧珍
[1
]
机构:
[1] 广西大学计算机与电子信息学院
[2] 广西气象减灾研究所
来源:
关键词:
数据挖掘;
关联规则;
频繁模式;
压缩FP-树;
D O I:
暂无
中图分类号:
TP311.13 [];
学科分类号:
1201 ;
摘要:
FP-growth算法是目前较高效的频繁模式挖掘算法之一.它只需扫描数据库两次,而且不需要产生和测试候选集,避免了这些费时的工作,因此该算法具有较高的效率.然而,FP-growth算法需要递归地生成大量的条件FP-树,这耗费了大量的存储空间和时间.综合已有的几项优势技术,提出了一种频繁模式挖掘算法CFPmine.一是采用了基于压缩FP-树的约束子树的挖掘方法,避免在挖掘过程中生成条件FP-树,减少内存占用;二是采用基于数组的技术,减少FP-树的遍历时间,提高算法的效率.另外,在算法中还实现了统一的内存管理.实验结果表明,CFPmine是一个高效的频繁模式挖掘算法,其性能优于Apriori,Eclat和FP-growth算法,而需要的内存却少于FP-growth算法.
引用
收藏
页码:244 / 249
页数:6
相关论文