一种基于前缀树的频繁模式挖掘算法

被引:5
作者
朱光喜
吴伟民
阮幼林
刘干
机构
[1] 华中科技大学计算机科学与技术学院
关键词
频繁模式; 频繁项集; FP-Tree; 前级树;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
挖掘频繁模式是许多数据挖掘任务的关键步骤。基于FP-Tree的挖掘算法由于无须生成候进项集效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高。因此,本文提出一种基于前缀树的新算法。该算法通过引入一种新结构—前缀树(Prefix Tree)用来压缩存放数据所相关信息,并通过调整前缀树中节点信息和节点键直接在Prefix Tree上采用深度优先的策略挖掘频繁模式,而不需要任何附加的数据结构,从而大大提高了挖掘效率。
引用
收藏
页码:34 / 36
页数:3
相关论文
共 7 条
  • [1] Association Analysis with One Scan of Databases. Huang H,Wu X,Relue R. Proc. of Pacific-Asia Conference . 2002
  • [2] A Tree Projection Algorithm for Generation of Frequent Itemsets. Agarwal R,Aggrawal C,Prasad V V V. Journal of Parallel and Distributed Computing . 2000
  • [3] An Effective Hash Based Algorithm for Mining Association Rules. Park J S,Chen M-S,Yu P S. Proc. ACM SIGMOD Int. Conf. on Management of Data . 1995
  • [4] Data Mining: An Overview from a Database Perspective. Chen M Y,Han J,Yu P. IEEE Transactions on Knowledge and Data Engineering . 1996
  • [5] Fast Algorithm for Mining Association Rules. Agrawal R,Srikant R. VLDB′94,Sep . 1994
  • [6] Ascending Frequency Ordered Prefix-tree: Efficient Mining of Frequent Patterns. Liu Guimei,Lu Hongjun,Xu Yabo,Yu J Xu. Proc. of 8th Database Systems for Advanced Applications (DAS-FAA′03) .
  • [7] Mining Frequent Patterns Without Candidate Generation. Han J,Pei J,Yin Y. Proc. ACM-SIGMOD . 2000