共 1 条
基于Hadoop的分布式朴素贝叶斯文本分类
被引:10
作者:
卫洁
石洪波
冀素琴
机构:
[1] 山西财经大学信息管理学院
来源:
关键词:
Hadoop;
朴素贝叶斯;
MapReduce;
文本分类;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
云计算的诞生,有效地解决了海量数据集的存储和分析处理。在云计算实现的开源Hadoop分布式系统集群上,使用MapReduce并行编程模型,设计并实现了一种对TFIDF改进的分布式朴素贝叶斯文本分类算法。实验结果表明,基于Hadoop框架的分布式朴素贝叶斯文本自动分类器不仅能处理节点失效,同时具有高效性和易扩展性的优势。
引用
收藏
页码:210 / 213
页数:4
相关论文