基于MapReduce技术的并行集成分类算法

被引:4
作者
琚春华 [1 ,2 ]
邹江波 [1 ]
张芮 [1 ]
魏建良 [1 ]
机构
[1] 浙江工商大学信息学院
[2] 浙江工商大学现代商贸研究中心
基金
浙江省自然科学基金;
关键词
云计算; 集成分类器; 并行集成; MapReduce;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
由于计算机内存资源限制,分类器组合的有效性及最优性选择是机器学习领域的主要研究内容。经典的集成分类算法在处理小数据集时,拥有较高的分类准确性,但面对大量数据时,由于多基分类器学习、分类共用1台计算机资源,导致运算效率较低,这显然不适合处理当今的海量数据。针对已有集成分类算法只适合作用于小规模数据集的缺点,剖析了集成分类器的特性,采用基于聚合方式的集成分类器和云计算的MapReduce技术设计了并行集成分类算法(EMapReduce),达到并行处理大规模数据的目的。并在Amazon计算集群上模拟实验,实验结果表明该算法具有一定的高效性和可行性。
引用
收藏
页码:40 / 47
页数:8
相关论文
共 9 条