基于MapReduce的朴素贝叶斯文本分类研究

被引:1
作者
严嘉铭
黄理灿
机构
[1] 浙江理工大学信息学院
关键词
Hadoop; MapReduce; 文本分类; 贝叶斯分类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
随着互联网的到来,其技术的发展导致了各种数据呈现出爆发式的增长,比如文本数据,分类算法在海量数据前面临着新的挑战。为了解决传统朴素贝叶斯分类算法在面临挑战中的不足,对其中关键词进行加权来提高分类准确率,然后通过Map Reduce编程模型,设计出朴素贝叶斯算法在Hadoop平台下的实现。实验表明:在Hadoop集群上通过并行化的设计朴素贝叶斯分类算法展现出了良好的性能,同时表现出了可靠的扩展性。
引用
收藏
页码:96 / 97+100 +100
页数:3
相关论文
共 3 条
[1]   基于MapReduce框架一种文本挖掘算法的设计与实现 [J].
朱蔷蔷 ;
张桂芸 ;
刘文龙 .
郑州大学学报(工学版), 2012, (05) :110-113
[2]   一种利用关联规则的改进朴素贝叶斯分类算法 [J].
陈朝大 ;
梁柱勋 ;
郑士基 .
计算机系统应用, 2010, 19 (11) :106-109
[3]  
Evaluation of standard SVDbased techniques for collaborativefiltering .2 M. Vozalis,A. Markos,K. Margaritis. Proceedings of the9thHellenic European Research on Computer Mathematics and its ApplicationsConference (HERCMA 2009) . 2009