自适应区间配置在关联规则并行采掘中的作用(英文)

被引:13
作者
胡侃
张伟荦
夏绍玮
机构
[1] 清华大学自动化系!北京
[2] 香港大学计算机科学系!香港
关键词
关联规则; 数据采掘; 并行采掘; 共享内存多处理器; 交易数据库;
D O I
暂无
中图分类号
TP311 [程序设计、软件工程];
学科分类号
081205 [计算机软件];
摘要
现行的采掘关联规则的并行算法基于经典的层次算法 .该方法在每一次重复扫描数据库时都需要一次同步 ,这种同步运算对于共享内存多处理器并行机来说极大地降低了采掘性能 ,这种低效主要源于对共享的 I/ O通道的竞争 .该文提出了在共享内存多处理机上采掘关联规则的异步算法 APM.在 APM中 ,所有参与计算的处理器能独立地产生备选集和计算支持度 .而且 ,APM所需的扫描数据库的次数比层次方法所需的更少 .该文还提出了一种增强 APM的技术 ,使得该算法的性能对于数据分布更具有鲁棒性 .文中实现了 APM的变种算法 ,还实现了 Apriori的并行版本 Count Distribution算法 .在 SGI Power Challenge SMP并行机上 ,进行了性能分析 ,结果表明所提出的异步算法 APM具有更好的性能和可扩展性 .
引用
收藏
页码:159 / 172
页数:14
相关论文
empty
未找到相关数据