大数据环境下基于SVM-WNB的网络舆情分类研究

被引:17
作者
张宸
韩夏
机构
[1] 四川大学图书馆
基金
中央高校基本科研业务费专项资金资助;
关键词
大数据; 网络舆情; Hadoop云平台; SVM-WNB算法; 并行处理;
D O I
10.13546/j.cnki.tjyjc.2017.14.010
中图分类号
TP18 [人工智能理论]; TP311.13 [];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 1201 ;
摘要
当前网络舆情信息存在数据量大、流动快及数据非结构化等特点,难以实现对其快速、准确的分类。SVM算法和朴素贝叶斯算法都是性能优秀的传统分类算法,但无法满足快速处理海量数据。文章利用Ha-doop平台可并行处理分布式数据存储的优良特性,提出了HSVMWNB分类算法,将采集的舆情文档依照HDFS架构进行本地化存储,并通过MapReduce进程完成并行分类处理。最后利用实验验证,本算法能够有效提升网络舆情分类能力与分类效率。
引用
收藏
页码:45 / 48
页数:4
相关论文
共 10 条
[1]   基于Hadoop的海量嘈杂数据决策树算法的实现 [J].
刘亚秋 ;
李海涛 ;
景维鹏 .
计算机应用, 2015, 35 (04) :1143-1147
[2]   大数据环境下舆情分析与决策支持研究文献综述 [J].
夏火松 ;
甄化春 .
情报杂志 , 2015, (02) :1-6+21
[3]   基于MapReduce的并行化最小最大模块化支持向量机研究 [J].
赵研 ;
李云 .
计算机研究与发展, 2014, (S2) :110-115
[4]   基于Hadoop框架的MapReduce计算模式的优化设计 [J].
孙彦超 ;
王兴芬 .
计算机科学, 2014, 41(S2) (S2) :333-336
[5]   基于大数据技术的网络舆情文本挖掘研究 [J].
李金海 ;
何有世 ;
熊强 .
情报杂志, 2014, 33 (10) :1-6+13
[6]   基于大数据的网络舆情分析方法研究 [J].
唐涛 .
现代情报 , 2014, (03) :3-6+11
[7]   MapReduce框架下的朴素贝叶斯算法并行化研究 [J].
幸莉仙 ;
黄慧连 .
计算机系统应用, 2013, 22 (02) :108-111
[8]   基于情感词典扩展技术的网络舆情倾向性分析 [J].
杨超 ;
冯时 ;
王大玲 ;
杨楠 ;
于戈 .
小型微型计算机系统, 2010, 31 (04) :691-695
[9]   SVM-KNN分类器——一种提高SVM分类精度的新方法 [J].
李蓉 ;
叶世伟 ;
史忠植 .
电子学报, 2002, (05) :745-748
[10]  
The Hadoop Distributed File System .2 Shvachko,K,Hairong Kuang. Mass Storage Systems and Technologies (MSST) 2010 IEEE 26th Symposium on . 2010