改进的基于频繁模式树的最大频繁项集挖掘算法——FP-MFIA

被引:32
作者
杨鹏坤 [1 ,2 ,3 ]
彭慧 [1 ,2 ,3 ]
周晓锋 [1 ,2 ,3 ]
孙玉庆 [4 ]
机构
[1] 中国科学院物联网研究发展中心
[2] 江苏物联网研究发展中心
[3] 无锡中科泛在信息技术研发中心有限公司
[4] 国网枣庄供电公司
关键词
最大频繁项集; 频繁模式树; 数据挖掘; 关联规则; 非频繁项集;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
针对最大频繁项目集挖掘算法(DMFIA)当候选项目集维数高而最大频繁项目集维数较低的情况下要产生大量的候选项目集的缺点,提出了一种改进的基于频繁模式树(FP-tree)结构的最大频繁项目集挖掘算法——FPMFIA。该算法根据FP-tree的项目头表,采用自底向上的搜索策略逐层挖掘最大频繁项目集,从而加速每次对候选集计数的操作。在挖掘时根据每层的条件模式基产生维数较低的非频繁项目集,尽早对候选项目集进行剪枝和降维,可大量减少候选项目集的数量。同时在挖掘时充分利用最大频繁项集的性质,减少搜索空间。通过算法在不同支持度下挖掘时间的对比可知,算法FP-MFIA在最小支持度较低的情况下时间效率是DMFIA以及基于降维的最大频繁模式挖掘算法(BDRFI)的2倍以上,说明FP-MFIA在候选集维数较高的时候优势明显。
引用
收藏
页码:775 / 778
页数:4
相关论文
共 7 条
[1]
基于FP-tree和约束概念格的关联规则挖掘算法及应用研究 [J].
付冬梅 ;
王志强 .
计算机应用研究, 2014, 31 (04) :1013-1015+1019
[2]
基于OWSFP-Tree的最大频繁项目集挖掘算法 [J].
赵志刚 ;
王芳 ;
万军 .
计算机工程与设计, 2013, 34 (05) :1687-1690+1807
[4]
关联规则中基于降维的最大频繁模式挖掘算法 [J].
钱雪忠 ;
惠亮 .
计算机应用, 2011, 31 (05) :1339-1343
[5]
SFPMax——基于排序FP树的最大频繁模式挖掘算法 [J].
秦亮曦 ;
史忠植 .
计算机研究与发展, 2005, (02) :217-223
[6]
最大频繁项目集的快速更新 [J].
吉根林 ;
杨明 ;
宋余庆 ;
孙志挥 .
计算机学报, 2005, (01) :128-135
[7]
基于FP-Tree的最大频繁项目集挖掘及更新算法 [J].
宋余庆 ;
朱玉全 ;
孙志挥 ;
陈耿 .
软件学报, 2003, (09) :1586-1592