FP-Growth算法的改进

被引:24
作者
杨云 [1 ]
罗艳霞 [1 ,2 ]
机构
[1] 陕西科技大学电气与信息工程学院
[2] 莆田学院电子信息工程系
关键词
数据挖掘; 关联规则; 频繁模式; 频繁项集; FP树;
D O I
10.16208/j.issn1000-7024.2010.07.034
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
基于FP树的FP-Growth算法在挖掘频繁模式过程中需要两次扫描事务集来建立FP树,这不仅降低了算法的效率,而且给数据库服务器带来负担。在原有经典FP-Growth算法的基础上,提出一种基于二维表的方法对原算法进行改进,改进算法通过使用二维向量记录频繁度仅需遍历一次事务集,从而省略FP-Growth算法在生成新条件FP树时对条件模式基的第一次遍历,大大缩短了建立FP树的时间。实验结果表明,该算法的改进优于经典算法。
引用
收藏
页码:1506 / 1509
页数:4
相关论文
共 9 条
[1]   用垂直数据格式构建FP增长树的算法 [J].
李洪波 ;
周莉 ;
张吉赞 .
计算机工程与应用 , 2009, (08) :161-164
[2]   一种改进的FP-Growth算法及其在业务关联中的应用 [J].
赵孝敏 ;
何松华 ;
李贤鹏 ;
尹波 .
计算机应用, 2008, (09) :2341-2344+2348
[3]   基于压缩FP-树和数组技术的频繁模式挖掘算法 [J].
秦亮曦 ;
苏永秀 ;
刘永彬 ;
梁碧珍 .
计算机研究与发展, 2008, (S1) :244-249
[4]   基于FP-Tree的约束关联规则挖掘算法 [J].
陈义明 ;
李舟军 ;
傅自纲 .
计算机工程与设计, 2007, (18) :4450-4453
[5]   数据仓库与数据挖掘技术 [J].
盛伟翔 ;
龙佳丽 .
电脑知识与技术(学术交流), 2007, (15) :631-632
[6]   一种基于MFP树的快速关联规则挖掘算法 [J].
李志云 ;
周国祥 .
计算机技术与发展, 2007, (06) :94-96+100
[7]   一种具有时序特征的告警关联规则挖掘算法 [J].
徐前方 ;
阚建杰 ;
李永春 ;
李荣盛 ;
郭军 .
微电子学与计算机, 2007, (03) :23-26
[8]   基于FP-Tree的最大频繁项目集挖掘及更新算法 [J].
宋余庆 ;
朱玉全 ;
孙志挥 ;
陈耿 .
软件学报, 2003, (09) :1586-1592
[9]   在FP-树中挖掘频繁模式而不生成条件FP-树 [J].
范明 ;
李川 ;
不详 .
计算机研究与发展 , 2003, (08) :1216-1222