快速更新全局频繁项目集

被引:19
作者
杨明
孙志挥
宋余庆
机构
[1] 东南大学计算机科学与工程系
[2] 东南大学计算机科学与工程系 江苏南京
[3] 安徽工程科技学院计算机科学与工程系
[4] 安徽芜湖
[5] 江苏南京
[6] 江苏大学计算机科学与通信工程学院
[7] 江苏镇江
基金
安徽省自然科学基金;
关键词
数据挖掘; 分布式数据库; 全局频繁项目集; 频繁模式树(FP-tree); 更新;
D O I
10.13328/j.cnki.jos.2004.08.011
中图分类号
TP311 [程序设计、软件工程];
学科分类号
081202 ; 0835 ;
摘要
数据挖掘中的频繁项目集更新算法研究是重要的研究课题之一.目前已有的频繁项目集更新算法主要针对单机环境,有关分布式环境下的全局频繁项目集的更新算法的研究尚不多见.为此,提出了快速更新全局频繁项目集算法(fast updating algorithm for globally frequent itemsets,简称FUAGFI).该算法主要考虑数据库记录增加时全局频繁项目集的更新情况.FUAGFI利用已建立的各局部频繁模式树(frequent pattern tree,简称FP-tree)及已挖掘的全局频繁项目集,可有效地降低网络通信量,提高全局频繁项目集的更新效率.实验结果表明,所提出的更新算法是行之有效的.
引用
收藏
页码:1189 / 1197
页数:9
相关论文
共 5 条
[1]   一种基于前缀广义表的关联规则增量式更新算法 [J].
杨明 ;
孙志挥 .
计算机学报, 2003, (10) :1318-1325
[2]   快速挖掘全局频繁项目集 [J].
杨明 ;
孙志挥 ;
吉根林 .
计算机研究与发展, 2003, (04) :620-626
[3]   一种基于分布式数据库的全局频繁项目集更新算法 [J].
杨明 ;
孙志挥 ;
吉根林 .
东南大学学报(自然科学版), 2002, (06) :879-883
[4]   关联规则的增量式更新算法 [J].
冯玉才 ;
冯剑琳 .
软件学报, 1998, (04) :62-67
[5]  
Effect of data skewness and workload balance in parallel data mining .2 CHEUNG D W,LEE S D,XIAO Y Q. IEEE Trans on Know-ledge and Data Engineering . 2002