数据挖掘中一种增强的Apriori算法分析

被引:16
作者
胡雪 [1 ]
封化民 [1 ,2 ]
李明伟 [1 ]
丁钊 [3 ]
机构
[1] 北京电子科技学院
[2] 西安电子科技大学通信工程学院
[3] 西安电子科技大学计算机学院
关键词
数据挖掘; 关联规则; 频繁项集; 事务数; 支持计数;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
在当今这个信息极度发达的社会,网络数据急剧膨胀,激增的数据背后隐藏着许多重要的信息,所以对大量数据进行分析是必要的。Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。可能产生大量的候选集,以及可能需要重复扫描数据库是Apriori算法的两大缺点。文中提出了一种需要更少的扫描时间的Apriori算法,在剪枝候选项集的同时也在消除冗余的子项集的产生。改进的Apriori算法通过消除数据库中不需要记录的传输有效减少了I/O所花费的时间,Apriori算法的效率得到了极大的优化。文章给出了算法实现思想及证明,并对传统的和改进的Apriori算法进行比较和分析。
引用
收藏
页码:77 / 83
页数:7
相关论文
共 11 条