压缩FP-Tree的改进搜索算法

被引:17
作者
吴倩
罗健旭
机构
[1] 华东理工大学信息学院
关键词
数据挖掘; 关联规则; 压缩频繁模式树; Apriori算法; 频繁模式增长算法;
D O I
10.16208/j.issn1000-7024.2015.07.019
中图分类号
TP311.13 [];
学科分类号
摘要
为克服Apriori算法候选频繁项集的支持数计算效率过低和频繁模式增长算法FP-Growth多次建立条件模式树时内存耗费大的问题,提出基于压缩频繁模式树(CFP-Tree)的改进搜索算法(MCFP-Tree)。利用Apriori算法候选项集生成的思想和压缩频繁模式树紧凑的数据结构,采用自底向上的搜索策略,快速挖掘压缩频繁模式树及其子树,更快得到候选项集的支持数。实验结果表明,该算法可以高效计算出候选频繁项集出现的频次,挖掘效率明显优于Apriori和FPGrowth算法。
引用
收藏
页码:1771 / 1777
页数:7
相关论文
共 4 条
[1]
云计算模型中关联规则增量更新方法 [J].
杨泽民 .
计算机工程与设计, 2014, 35 (02) :504-508
[2]
云环境下关联规则算法的研究 [J].
周丽娟 ;
王翔 .
计算机工程与设计, 2014, 35 (02) :499-503
[3]
基于COFI-Tree的N-最有兴趣项目集挖掘算法 [J].
肖继海 ;
崔晓红 ;
陈俊杰 .
计算机技术与发展, 2012, 22 (03) :99-102
[4]
频繁项集挖掘的Apriori改进算法研究 [J].
栗晓聪 ;
滕少华 .
江西师范大学学报(自然科学版), 2011, 35 (05) :498-502