一种基于FP-Tree的频繁模式挖掘自适应算法

被引:5
作者
张锦
马海兵
胡运发
机构
[1] 复旦大学计算机与信息技术系
关键词
数据挖掘; 关联规则; 频繁模式; FP-树; 鲁棒性; 自适应;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
140502 [人工智能];
摘要
不同数据集中数据的不同分布特征,对于频繁模式挖掘算法往往有着较大影响。将不同的现有算法结合起来,根据数据集的不同特性采用不同的挖掘策略,有可能构造出鲁棒性强的新算法。本文首先提出了一种基于FP-tree的简单深度优先搜索算法NDFS,并简单分析了其在不同数据集上的特性。在分析的基础上,本文进一步将NDFS和经典的FP-growth算法进行结合,提出了一种在挖掘过程中根据局部空间特征动态采用不同策略的自适应算法SAFP。实验证明,SAFP算法在不同数据集上均能达到或优于原有最优算法的性能,具有较好的鲁棒性。
引用
收藏
页码:763 / 768
页数:6
相关论文
共 2 条
[1]
Advances in frequent itemset mining implementations.[J].Bart Goethals;Mohammed J. Zaki.ACM SIGKDD Explorations Newsletter.2004, 1
[2]
A tree projection algorithm for generation of frequent item sets [J].
Agarwal, RC ;
Aggarwal, CC ;
Prasad, VVV .
JOURNAL OF PARALLEL AND DISTRIBUTED COMPUTING, 2001, 61 (03) :350-371