基于FP-tree的最大频繁项目集挖掘算法

被引:4
作者
马丽生 [1 ]
邓辉文 [2 ]
齐逸 [2 ]
机构
[1] 滁州学院计算机科学与技术系
[2] 西南大学计算机与信息科学学院
关键词
数据挖掘; 关联规则; 频繁项目集; 最大频繁项目集; 频繁模式树;
D O I
10.16208/j.issn1000-7024.2008.02.027
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
最大频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上提出了FP-MMFI算法,它是对FP-growth算法在最大频繁项目集挖掘上的扩展。提出了频繁路径的概念,用它可以有效地对FP-tree进行压缩和缩小搜索空间,同时使用投影的方法对超集检测进行了优化,减少了项目匹配的次数。最后实验结果表明,该算法在性能上优于已有的同类算法。
引用
收藏
页码:385 / 388
页数:4
相关论文
共 4 条
[1]   一种新的最大频繁项目集挖掘算法 [J].
马丽生 ;
邓辉文 ;
齐逸 .
计算机应用, 2006, (11) :2670-2673
[2]   基于FP-Tree有效挖掘最大频繁项集 [J].
颜跃进 ;
李舟军 ;
陈火旺 .
软件学报, 2005, (02) :215-222
[3]   挖掘最大频繁模式的新方法 [J].
刘君强 ;
孙晓莹 ;
王勋 ;
潘云鹤 .
计算机学报, 2004, (10) :1328-1334
[4]  
(加)JiaweiHan,(加)MichelineKamber著,范明,孟小峰等译.数据挖掘[M].北京:机械工业出版社,2001