基于微博数据的“新冠肺炎疫情”舆情演化时空分析

被引:82
作者
陈兴蜀 [1 ,2 ]
常天祐 [3 ,4 ]
王海舟 [1 ,2 ]
赵志龙 [3 ,4 ]
张杰 [1 ]
机构
[1] 四川大学网络空间安全学院
[2] 四川大学网络空间安全研究院
[3] 四川大学吴玉章学院
[4] 四川大学计算机学院
关键词
新浪微博; 新冠肺炎疫情; 分布式爬虫; 情感分析; 文本聚类; 地理统计分析;
D O I
暂无
中图分类号
R181 [流行病学基本理论与方法]; TP391.1 [文字信息处理];
学科分类号
摘要
本文依托2020年1月1日至2月29日期间共计6万条新浪微博博文与1.5万条微博热门评论,基于分布式爬虫技术、分布式数据库系统、SnowNLP情感分析模型以及KMeans文本聚类算法,对与"新冠肺炎疫情"相关的话题展开舆情分析,可视化地展现本次疫情事件中网络舆情的时空演化过程.在时间维度层面,通过文本聚类与情感分析,发现网民对于此次肺炎疫情的态度大致经历了三个阶段,即起伏不定的紧张焦虑期、缓慢攀升的团结振作期以及波动很小的自信平稳期,总体上呈现积极大于消极、正面大于负面的情绪状态.在空间维度层面,通过地理统计分析,发现疫情最严重地区网民评论人数最多,同时情感值也最低.
引用
收藏
页码:409 / 416
页数:8
相关论文
共 18 条
[1]   基于微博数据的台风“山竹”舆情演化时空分析 [J].
张岩 ;
李英冰 ;
郑翔 .
山东大学学报(工学版), 2020, 50 (05) :118-126
[2]   融合k-means聚类和Hausdorff距离的散乱点云精简算法 [J].
李健 ;
曹垚 ;
王宗敏 ;
王广印 .
武汉大学学报(信息科学版), 2020, 45 (02) :250-257
[3]   基于短语级情感分析的不良信息检测方法 [J].
明弋洋 ;
刘晓洁 .
四川大学学报(自然科学版), 2019, 56 (06) :1042-1048
[4]   网络舆情监测系统的分析与设计 [J].
洪小娟 ;
宗江燕 ;
于建坤 ;
黄卫东 .
软件工程, 2019, (08) :37-39+13
[5]   基于密度峰值的改进K-Means文本聚类算法及其并行化 [J].
袁逸铭 ;
刘宏志 ;
李海生 .
武汉大学学报(理学版), 2019, 65 (05) :457-464
[6]   多特征融合的图文微博情感分析 [J].
凌海彬 ;
缪裕青 ;
张万桢 ;
周明 ;
武继刚 .
计算机应用研究, 2020, 37 (07) :1935-1939+1951
[7]   多策略融合的微博数据获取技术研究 [J].
王培名 ;
陈兴蜀 ;
王海舟 ;
王文贤 .
山东大学学报(理学版), 2019, 54 (05) :28-36+43
[8]   基于扩展的情感词典和卡方模型的中文情感特征选择方法 [J].
胡思才 ;
孙界平 ;
琚生根 ;
王霞 ;
龙彬 ;
廖强 .
四川大学学报(自然科学版), 2019, 56 (01) :37-44
[9]   基于新浪微博的2018年云南通海5.0级地震舆情时空特征分析 [J].
曹彦波 .
地震研究, 2018, 41 (04) :525-533
[10]   微博中蕴含台风灾害损失信息识别和分类方法 [J].
杨腾飞 ;
解吉波 ;
李振宇 ;
李国庆 .
地球信息科学学报, 2018, (07) :906-917