基于分布数据库的快速关联规则挖掘算法

被引:13
作者
陈耿 [1 ]
倪巍伟 [2 ]
朱玉全 [3 ]
孙志挥 [2 ]
机构
[1] 南京审计学院
[2] 东南大学计算机科学与工程系
[3] 江苏大学计算机科学与通信工程学院
关键词
频繁项目集; 分布式关联规则挖掘; 数据挖掘; 布尔关联规则;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
关联规则发现是数据挖掘的重要研究内容,随着数据库中数据的不断增加,大数据集环境下的关联规则发现日益受到重视,分布式关联规则发现是解决这一问题的有效方法。分布式数据库环境下的关联规则挖掘算法中,时间开销主要体现在两方面(:1)频繁项目集的确定;(2)网络的通讯量。为了解决第一个问题,文章提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些”或”、”与”、”异或”等逻辑运算操作,显著降低了算法的实现难度。将该算法与DMA算法相结合提出改进算法FDMA。理论分析和实验结果表明,算法FDMA大大提高了关联规则挖掘的效率,算法是有效可行的。
引用
收藏
页码:165 / 167+194 +194
页数:4
相关论文
共 7 条
[1]  
MData Mining:Concepts and Techniques. Han J Kamber. . 2001
[2]  
Scalable Algorithms for Association Mining. Zaki M J. IEEE Tran-sactions on Knowledge and Data Engineering . 2000
[3]  
Efficient Mining of Association Rules in Distributed Databases. Cheung David W,Ng Vincent T,Fu Ada W. IEEE Transactions on Knowledge and Data Engineering . 1996
[4]  
Parallel mining of association rules. Agrawal R,Shafer J C. IEEE Transactions on Knowledge and Data Engineering . 1996
[5]  
Scalable Parallel Data Mining for Association Rules. Han Eui-Hong,Karypis G,Kumar V. IEEE Transactions on Knowledge and Data Engineering . 2000
[6]  
Effect of Data Skewness and Workload Balance in Parallel Data Mining. Cheung D W,Lee S D,Xiao Y Q. IEEE Transactions on Knowledge and Data Engineering . 2002
[7]  
Survey on frequent pattern mining. Goethals B. . 2003