基于Hash表的关联规则挖掘算法的改进

被引:10
作者
卢云彬
曹汉强
机构
[1] 华中科技大学电子与信息工程系
关键词
数据挖掘; 关联规则; Apriori算法; DHP算法; Hash表;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
经典的Apriori算法在大项目集的挖掘过程中因为重复搜索导致效率低下。提出一种改进的Hash表结构应用于DHP算法中的项目集存放,定义新的Hash函数确定项目集的存放地址,并基于新的Hash表结构,以并行挖掘的方式优化关联规则算法的剪枝过程。实验结果表明,与Apriori算法相比,文中的方法可以更好地节省存储空间,提高挖掘效率。
引用
收藏
页码:12 / 14
页数:3
相关论文
共 3 条
[1]  
Using a Hash-Based Method with Transaction Trimming for Mining Associ-ation Rules. Park Jong Soo,Chen Ming-Syan,Yu P S. Knowledge and Data Engineering,IEEETransactions . 1997
[2]  
Database mining:a perfor-mance perspective. Agrawal R,Imielinski T,Swami A. Knowledge and Data Engineering,IEEETransactions . 1993
[3]  
Mining association rulesbetween sets of items in large databases. Agrawal R,Imielinski T,Swami A. ACM SIGMODRecord . 1993