一种基于事务树的快速频繁项集挖掘与更新算法

被引:3
作者
阮幼林
李庆华
杨世达
机构
[1] 华中科技大学计算机科学与技术学院
关键词
频繁项集; 频繁模式树; 事务树; 更新;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
挖掘频繁项集是数据挖掘研究中的关键问题。基于FP-Tree的挖掘及其更新算法无需生成候选项目集因而效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、必须两次扫描数据库等缺点。因此,本文提出一种基于事务树Trans-Tree的新算法。该算法通过引入一种新结构—事务树Trans-Tree来压缩存放数据的相关信息且易于更新,挖掘算法只需对数据库扫描一次,而且更新算法只需对新增数据扫描一次,无需扫描原始数据,从而大大提高了频繁项集的挖掘和维护效率。
引用
收藏
页码:210 / 212
页数:3
相关论文
共 7 条
[1]  
Association Analysis with One Scan of Databases. Huang H,Wu X,Relue R. Proc. of Pacific-Asia Conf. PAKDD . 2002
[2]  
Data Mining: An Overview from a Database Perspective. Chen M Y,Han J,Yu P. IEEE Transactions on Knowledge and Data Engineering . 1996
[3]  
A Tree Projection Algorithm for Generation of Frequent Itemsets. Agarwal R,Aggrawal C,Prasad V V V. Journal of parallel and Distributed Computing . 2000
[4]  
An Effective Hash Based Algorithm for Mining Association Rules. Park J S,Chen M-S,Yu P S. Proc. ACM SIGMOD Int. Conf. on Management of Data . 1995
[5]  
Mining Frequent Patterns Without Candidate Generation. Han J,Pei J,Yin Y. Proc. ACM-SIGMOD . 2000
[6]  
Incremental Mining of Frequent Without Candidate Generation or Support Constraint. Cheung W,Zaiane O R. Proc. of 7th Database Engineering and Applications Symposium (IDEAS‘03) .
[7]  
Fast Algorithm for Mining Association Rules. Agrawal R,Srikant R. VLDB‘94 . 1994