基于MR的并行决策树分类算法的设计与实现

被引:9
作者
朱敏
万剑怡
王明文
机构
[1] 江西师范大学计算机信息工程学院
关键词
MapReduce; 决策树分类; SPRINT;
D O I
10.16088/j.issn.1001-6600.2011.01.011
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
决策树分类方法是实现数据挖掘中分类任务的一种有效方法,但在大规模测试数据集上运行时其实现性能受到严重影响。本文设计和实现一种基于MapReduce架构的并行决策树分类算法。实验结果表明:基于MapReduce的决策树分类算法比同类算法在其他并行编程模型下的实现在计算节点较多的情况下能得到更优的性能。
引用
收藏
页码:82 / 86
页数:5
相关论文
共 4 条
[1]   云计算下的海量数据挖掘研究 [J].
王鄂 ;
李铭 .
现代计算机(专业版), 2009, (11) :22-25+50
[2]   Approach of generating parallel programs from parallelized algorithm design strategies [J].
WAN Jianyi LI Xiaoying College of Computer Information and Engineering Jiangxi Normal University Nanchang China .
TheJournalofChinaUniversitiesofPostsandTelecommunications, 2008, (03) :128-132
[3]   一种基于离散度的决策树改进算法 [J].
郭玉滨 .
山东师范大学学报(自然科学版) , 2006, (03) :129-131
[4]   基于SPRINT方法的并行决策树分类研究 [J].
魏红宁 .
计算机应用, 2005, (01) :39-41