数据挖掘网格中决策树并行算法设计及性能分析

被引:4
作者
陈平 [1 ]
乔秀全 [2 ]
刘臻 [1 ]
田小萍 [1 ]
机构
[1] 北京师范大学信息网络中心
[2] 北京邮电大学网络与交换技术国家重点实验室
基金
高等学校博士学科点专项科研基金;
关键词
数据挖掘; 网格计算; 决策树; 并行性能;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
提出了C4.5决策树算法的一种并行算法,使传统的串行分类算法能在多台PC机和服务器组成的数据挖掘网格上并行数据挖掘.采用数据纵横剖分,结合递归过程的并行化,实现了可扩展的高性能并行计算,解决了处理海量数据时没有较好并行分类算法的问题.并给出了指导该并行算法高效计算的方法.数据运行试验和算法分析表明,该并行算法的性能受多个因素影响,并具有高效的并行效率计算加速比.
引用
收藏
页码:49 / 52
页数:4
相关论文
共 2 条
  • [1] 大规模问题数据并行性能的分析
    舒继武estcstsinghuaeducn郑纬民沈美明汪东升
    [J]. 软件学报, 2000, (05) : 628 - 633
  • [2] 并行计算[M]. 高等教育出版社 , 陈国良编著, 1999