频繁项集挖掘的Apriori改进算法研究

被引:27
作者
栗晓聪
滕少华
机构
[1] 广东工业大学计算机学院
基金
广东省自然科学基金;
关键词
Apriori算法; 频繁项集; 候选项集; IApriori算法;
D O I
10.16357/j.cnki.issn1000-5862.2011.05.003
中图分类号
TP311.13 [];
学科分类号
摘要
针对Apriori算法的不足,提出了一种新的优化算法——IApriori.该算法应用散列技术优化产生频繁-2项集,优化连接操作减少连接判断的次数,通过对候选项集编码来减少扫描数据库的次数,优化逻辑"与"运算减少不必要的"与"操作次数,缩短生成频繁项集的时间.IApriori算法仅需3次扫描数据库.研究结果表明,该算法具有快速、直观、节省内存等优点.
引用
收藏
页码:498 / 502
页数:5
相关论文
共 11 条
[1]
基于待与项集的频繁项集挖掘算法的研究 [J].
傅慧 ;
邹海 .
计算机工程与设计, 2009, 30 (01) :129-131
[2]
基于散列的关联规则AprioriTid改进算法 [J].
俞燕燕 ;
李绍滋 .
计算机工程, 2008, (05) :60-62
[3]
基于FP-Tree的反向频繁项集挖掘 [J].
郭宇红 ;
童云海 ;
唐世渭 ;
杨冬青 .
软件学报, 2008, (02) :338-350
[4]
Apriori挖掘频繁项目集算法的改进 [J].
柴华昕 ;
王勇 .
计算机工程与应用, 2007, (24) :158-161+171
[5]
基于协议分析的散列模式入侵检测方法 [J].
王琳 ;
滕少华 ;
伍乃骐 .
计算机工程与设计, 2006, (01) :53-55+178
[6]
关联规则挖掘中若干关键技术的研究 [J].
陈耿 ;
朱玉全 ;
杨鹤标 ;
陆介平 ;
宋余庆 ;
孙志挥 .
计算机研究与发展, 2005, (10)
[7]
基于FP-Tree有效挖掘最大频繁项集 [J].
颜跃进 ;
李舟军 ;
陈火旺 .
软件学报, 2005, (02) :215-222
[8]
Apriori算法的三种优化方法 [J].
徐章艳 ;
刘美玲 ;
张师超 ;
卢景丽 ;
区玉明 .
计算机工程与应用, 2004, (36) :190-192+202
[9]
生成频繁项集的逻辑“与”运算算法 [J].
徐健辉 .
计算机应用, 2004, (11) :88-90
[10]
数据挖掘.[M].(加)JiaweiHan;(加)MichelineKamber著;范明;孟小峰等译;.机械工业出版社.2001,