快速挖掘全局最大频繁项目集

被引:60
作者
陆介平
杨明
孙志挥
鞠时光
机构
[1] 东南大学计算机科学与工程系
[2] 江苏大学计算机科学与通信工程学院 江苏南京
[3] 江苏镇江
关键词
分布式数据库; 数据挖掘; 频繁模式树; 全局最大频繁项目集;
D O I
暂无
中图分类号
TP311 [程序设计、软件工程];
学科分类号
081205 [计算机软件];
摘要
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题.现行可用的最大频繁项目集挖掘算法大多基于单机环境,针对分布式环境下的全局最大频繁项目集挖掘尚不多见.若将基于单机环境的最大频繁项目集挖掘算法运用于分布式环境,或运用分布式环境下的全局频繁项目集挖掘算法来挖掘全局最大频繁项目集,均会产生大量的候选频繁项目集,且网络通信代价高.为此,提出了快速挖掘全局最大频繁项目集算法FMGMFI(fast mining globalmaximum frequent itemsets),该算法采用FP-tree存储结构,可方便地从各局部FP-tree的相关路径中得到项目集的频度,同时采用自顶向下和自底向上的双向搜索策略,可有效地降低网络通信代价.实验结果表明,FMGMF算法是有效、可行的.
引用
收藏
页码:553 / 560
页数:8
相关论文
共 4 条
[1]
一种基于前缀广义表的关联规则增量式更新算法 [J].
杨明 ;
孙志挥 .
计算机学报, 2003, (10) :1318-1325
[2]
基于FP-Tree的最大频繁项目集挖掘及更新算法 [J].
宋余庆 ;
朱玉全 ;
孙志挥 ;
陈耿 .
软件学报, 2003, (09) :1586-1592
[3]
快速挖掘全局频繁项目集 [J].
杨明 ;
孙志挥 ;
吉根林 .
计算机研究与发展, 2003, (04) :620-626
[4]
快速开采最大频繁项目集 [J].
路松峰 ;
卢正鼎 .
软件学报, 2001, (02) :293-297