基于大数据技术的网络舆情文本挖掘研究

被引:58
作者
李金海
何有世
熊强
机构
[1] 江苏大学管理学院
关键词
大数据; MapReduce; 分布式数据库; 网络舆情; 舆情指数;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
通过分析大数据与网络舆情数据的相似特征,基于大数据思想构建网络舆情的文本挖掘模块,并在此基础上构建预警模型,对关系型数据库与分布式数据库进行了融合,使之适应模型从数据采集到分析查询的全部流程;并对大数据核心技术MapReduce进行扩展,改进的MapReduce贯穿于数据处理模块的文本特征向量提取与舆情指数的矩阵-向量乘积运算。通过仿真实验,证明该模型具有一定的准确性与良好的时效性。
引用
收藏
页码:1 / 6+13 +13
页数:7
相关论文
共 12 条