基于前缀项集的Apriori算法改进

被引:22
作者
于守健
周羿阳
机构
[1] 东华大学计算机学院
关键词
数据挖掘; Apriori算法; 前缀项集; 关联规则; 哈希表;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
关联规则的挖掘是数据挖掘中一个重要内容,主要目的是找到事务数据库中的有趣的模式。Apriori算法是关联规则挖掘的最经典算法之一,但是它本身存在着效率上的瓶颈。在深入了解Apriori算法前提下,提出基于前缀项集的候选集存储结构,并利用哈希表在快速查找上的优势,大大提高了经典Apriori算法在连接步骤和剪枝步骤中的效率。实验证明改进后的Apriori算法在一定支持度下比经典Apriori算法有着更大的效率优势,并且支持度越小时提升效率越大。
引用
收藏
页码:290 / 294
页数:5
相关论文
共 1 条
[1]
Medical diagnosis data mining based on improved Apriori algorithm [J].
Zhang, Wenjing ;
Ma, Donglai ;
Yao, Wei .
Journal of Networks, 2014, 9 (05) :1339-1345