基于垂直数据分布的大型稠密数据库快速关联规则挖掘算法

被引:21
作者
崔建
李强
杨龙坡
机构
[1] 空军雷达学院预警监视情报系
关键词
CARMA算法; DAG; diffset差集; 垂直数据分布; 稠密数据库;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
为进一步解决对大型事务数据库进行关联规则挖掘时产生的CPU时间开销大和I/O操作频繁的问题,给出了一种基于垂直数据分布的改进关联规则挖掘算法,称为VARMLDb算法。该算法首先有效地把数据库分为内存可以满足要求的若干划分,然后结合有向无环图和垂直数据形式diffset差集来存储和计算频繁项集,极大地减少了存储中间结果所需的内存大小,解决了传统垂直数据挖掘算法对稠密数据库挖掘效率低下的问题,使该算法可有效地适用于大型稠密数据库的关联规则挖掘。整个算法吸取CARMA算法的优势,只需扫描两次数据库便可完成挖掘过程。实验结果表明该算法是正确的,在大型稠密数据库中,VARMLDb算法具有较高的执行效率。
引用
收藏
页码:216 / 220
页数:5
相关论文
共 6 条
[1]   改进的Eclat数据挖掘算法的研究 [J].
宋长新 ;
马克 .
微计算机信息, 2008, (24) :92-94
[2]   一种基于矩阵的关联规则挖掘新算法 [J].
丁艳辉 ;
王洪国 ;
高明 ;
谷建军 .
计算机科学, 2006, (04) :188-189+197
[3]  
关联规则中ECLAT算法的研究与应用[D]. 耿晓斐.重庆大学. 2009
[4]  
Utility Independent Privacy Preserving Data Mining on Vertically Partitioned Data[J] . E. Poovammal,M. Ponnavaikko.Journal of Computer Science . 2009 (9)
[5]  
Mining Multiple-Level Association Rules in Large Databases .2 HAN J W,FU Y J. IEEE Transactions of Knowledge and Data Engineering . 1999
[6]  
Mafia: A maximal frequent itemset algorithm for transactional databases .2 Burdick D,Calimlim M,Gehrke J. Proceedings of 17th International Conference on Data Engineering . 2001