学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
大数据环境下基于SVM-WNB的网络舆情分类研究
被引:17
作者
:
论文数:
引用数:
h-index:
机构:
张宸
论文数:
引用数:
h-index:
机构:
韩夏
机构
:
[1]
四川大学图书馆
来源
:
统计与决策
|
2017年
/ 14期
基金
:
中央高校基本科研业务费专项资金资助;
关键词
:
大数据;
网络舆情;
Hadoop云平台;
SVM-WNB算法;
并行处理;
D O I
:
10.13546/j.cnki.tjyjc.2017.14.010
中图分类号
:
TP18 [人工智能理论];
TP311.13 [];
学科分类号
:
081104 ;
0812 ;
0835 ;
1405 ;
1201 ;
摘要
:
当前网络舆情信息存在数据量大、流动快及数据非结构化等特点,难以实现对其快速、准确的分类。SVM算法和朴素贝叶斯算法都是性能优秀的传统分类算法,但无法满足快速处理海量数据。文章利用Ha-doop平台可并行处理分布式数据存储的优良特性,提出了HSVMWNB分类算法,将采集的舆情文档依照HDFS架构进行本地化存储,并通过MapReduce进程完成并行分类处理。最后利用实验验证,本算法能够有效提升网络舆情分类能力与分类效率。
引用
收藏
页码:45 / 48
页数:4
相关论文
共 10 条
[1]
基于Hadoop的海量嘈杂数据决策树算法的实现
[J].
刘亚秋
论文数:
0
引用数:
0
h-index:
0
机构:
东北林业大学信息与计算机工程学院
黑龙江省林业生态大数据存储与高性能(云)计算工程技术研究中心
东北林业大学信息与计算机工程学院
刘亚秋
;
论文数:
引用数:
h-index:
机构:
李海涛
;
景维鹏
论文数:
0
引用数:
0
h-index:
0
机构:
东北林业大学信息与计算机工程学院
黑龙江省林业生态大数据存储与高性能(云)计算工程技术研究中心
东北林业大学信息与计算机工程学院
景维鹏
.
计算机应用,
2015,
35
(04)
:1143
-1147
[2]
大数据环境下舆情分析与决策支持研究文献综述
[J].
论文数:
引用数:
h-index:
机构:
夏火松
;
论文数:
引用数:
h-index:
机构:
甄化春
.
情报杂志 ,
2015,
(02)
:1
-6+21
[3]
基于MapReduce的并行化最小最大模块化支持向量机研究
[J].
论文数:
引用数:
h-index:
机构:
赵研
;
李云
论文数:
0
引用数:
0
h-index:
0
机构:
南京邮电大学计算机学院
李云
.
计算机研究与发展,
2014,
(S2)
:110
-115
[4]
基于Hadoop框架的MapReduce计算模式的优化设计
[J].
孙彦超
论文数:
0
引用数:
0
h-index:
0
机构:
北京信息科技大学
孙彦超
;
论文数:
引用数:
h-index:
机构:
王兴芬
.
计算机科学,
2014,
41(S2)
(S2)
:333
-336
[5]
基于大数据技术的网络舆情文本挖掘研究
[J].
论文数:
引用数:
h-index:
机构:
李金海
;
论文数:
引用数:
h-index:
机构:
何有世
;
论文数:
引用数:
h-index:
机构:
熊强
.
情报杂志,
2014,
33
(10)
:1
-6+13
[6]
基于大数据的网络舆情分析方法研究
[J].
论文数:
引用数:
h-index:
机构:
唐涛
.
现代情报 ,
2014,
(03)
:3
-6+11
[7]
MapReduce框架下的朴素贝叶斯算法并行化研究
[J].
论文数:
引用数:
h-index:
机构:
幸莉仙
;
论文数:
引用数:
h-index:
机构:
黄慧连
.
计算机系统应用,
2013,
22
(02)
:108
-111
[8]
基于情感词典扩展技术的网络舆情倾向性分析
[J].
论文数:
引用数:
h-index:
机构:
杨超
;
论文数:
引用数:
h-index:
机构:
冯时
;
王大玲
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学医学影像计算教育部重点实验室
东北大学信息科学与工程学院
东北大学信息科学与工程学院
王大玲
;
论文数:
引用数:
h-index:
机构:
杨楠
;
论文数:
引用数:
h-index:
机构:
于戈
.
小型微型计算机系统,
2010,
31
(04)
:691
-695
[9]
SVM-KNN分类器——一种提高SVM分类精度的新方法
[J].
李蓉
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技大学研究生院(北京)计算机教学部
李蓉
;
叶世伟
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技大学研究生院(北京)计算机教学部
叶世伟
;
史忠植
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技大学研究生院(北京)计算机教学部
史忠植
.
电子学报,
2002,
(05)
:745
-748
[10]
The Hadoop Distributed File System .2 Shvachko,K,Hairong Kuang. Mass Storage Systems and Technologies (MSST) 2010 IEEE 26th Symposium on . 2010
←
1
→
共 10 条
[1]
基于Hadoop的海量嘈杂数据决策树算法的实现
[J].
刘亚秋
论文数:
0
引用数:
0
h-index:
0
机构:
东北林业大学信息与计算机工程学院
黑龙江省林业生态大数据存储与高性能(云)计算工程技术研究中心
东北林业大学信息与计算机工程学院
刘亚秋
;
论文数:
引用数:
h-index:
机构:
李海涛
;
景维鹏
论文数:
0
引用数:
0
h-index:
0
机构:
东北林业大学信息与计算机工程学院
黑龙江省林业生态大数据存储与高性能(云)计算工程技术研究中心
东北林业大学信息与计算机工程学院
景维鹏
.
计算机应用,
2015,
35
(04)
:1143
-1147
[2]
大数据环境下舆情分析与决策支持研究文献综述
[J].
论文数:
引用数:
h-index:
机构:
夏火松
;
论文数:
引用数:
h-index:
机构:
甄化春
.
情报杂志 ,
2015,
(02)
:1
-6+21
[3]
基于MapReduce的并行化最小最大模块化支持向量机研究
[J].
论文数:
引用数:
h-index:
机构:
赵研
;
李云
论文数:
0
引用数:
0
h-index:
0
机构:
南京邮电大学计算机学院
李云
.
计算机研究与发展,
2014,
(S2)
:110
-115
[4]
基于Hadoop框架的MapReduce计算模式的优化设计
[J].
孙彦超
论文数:
0
引用数:
0
h-index:
0
机构:
北京信息科技大学
孙彦超
;
论文数:
引用数:
h-index:
机构:
王兴芬
.
计算机科学,
2014,
41(S2)
(S2)
:333
-336
[5]
基于大数据技术的网络舆情文本挖掘研究
[J].
论文数:
引用数:
h-index:
机构:
李金海
;
论文数:
引用数:
h-index:
机构:
何有世
;
论文数:
引用数:
h-index:
机构:
熊强
.
情报杂志,
2014,
33
(10)
:1
-6+13
[6]
基于大数据的网络舆情分析方法研究
[J].
论文数:
引用数:
h-index:
机构:
唐涛
.
现代情报 ,
2014,
(03)
:3
-6+11
[7]
MapReduce框架下的朴素贝叶斯算法并行化研究
[J].
论文数:
引用数:
h-index:
机构:
幸莉仙
;
论文数:
引用数:
h-index:
机构:
黄慧连
.
计算机系统应用,
2013,
22
(02)
:108
-111
[8]
基于情感词典扩展技术的网络舆情倾向性分析
[J].
论文数:
引用数:
h-index:
机构:
杨超
;
论文数:
引用数:
h-index:
机构:
冯时
;
王大玲
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学医学影像计算教育部重点实验室
东北大学信息科学与工程学院
东北大学信息科学与工程学院
王大玲
;
论文数:
引用数:
h-index:
机构:
杨楠
;
论文数:
引用数:
h-index:
机构:
于戈
.
小型微型计算机系统,
2010,
31
(04)
:691
-695
[9]
SVM-KNN分类器——一种提高SVM分类精度的新方法
[J].
李蓉
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技大学研究生院(北京)计算机教学部
李蓉
;
叶世伟
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技大学研究生院(北京)计算机教学部
叶世伟
;
史忠植
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技大学研究生院(北京)计算机教学部
史忠植
.
电子学报,
2002,
(05)
:745
-748
[10]
The Hadoop Distributed File System .2 Shvachko,K,Hairong Kuang. Mass Storage Systems and Technologies (MSST) 2010 IEEE 26th Symposium on . 2010
←
1
→