在FP-树中挖掘频繁模式而不生成条件FP-树

被引:53
作者
范明
李川
不详
机构
[1] 郑州大学计算机科学系
[2] 郑州大学计算机科学系 郑州
[3] 郑州
关键词
数据挖掘; 频繁模式; FP-树;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
FP growth算法是目前已发表的最有效的频繁模式挖掘算法之一 然而 ,由于在挖掘频繁模式时需要递归地生成大量的条件FP 树 ,其时空效率仍然不够高 改进了FP 树结构 ,提出了一种基于被约束子树挖掘频繁项集的有效算法 改进的FP 树是单向的 ,每个结点只保留指向父结点的指针 ,这大约节省了三分之一的树空间 通过引入被约束子树(可以用 3个很小的数组表示 ) ,算法在挖掘频繁模式时不生成条件FP 树 ,从而大大提高了频繁模式挖掘的时空效率 实验表明 ,与FP growth算法相比 ,算法的挖掘速度提高了 1倍以上 ,而所需的存储空间减少了一半 此外 ,随着数据库规模的增大 ,算法具有很好的可伸缩性 对于稠密数据集 ,算法也具有良好的性能 .
引用
收藏
页码:1216 / 1222
页数:7
相关论文
共 1 条
[1]  
A condensed representation to find frequent patterns. Artur Bykowski,Christophe Rigotti. In: Proc of the 20th ACM SIGACTSIGMOD-SIGART Symp on Principles of Database Systems(PODS 2001) . 2001