共 18 条
基于LDA和随机森林的微博谣言识别研究——以2016年雾霾谣言为例
被引:60
作者:
曾子明
[1
,2
]
王婧
[1
,2
]
机构:
[1] 武汉大学信息资源研究中心
[2] 武汉大学图书情报实验教学中心
来源:
关键词:
微博;
谣言识别;
LDA;
随机森林;
雾霾;
D O I:
暂无
中图分类号:
G206 [传播理论];
G254 [文献标引与编目];
学科分类号:
050302 ;
1205 ;
120501 ;
摘要:
网络谣言的肆虐对人们的日常生活和社会稳定造成了较为严重的负面影响,为了辅助网络谣言管控的有效推进,本文以2016年雾霾谣言为例,根据微博数据和以往研究定义了用户可信度和微博影响力特征变量,采用LDA主题模型深入挖掘微博文本的主题分布特征,并基于以上特征变量采用随机森林算法进行谣言识别的模型训练。实验表明,LDA提取的文档-主题分布特征在谣言识别中发挥了重要作用,且基于LDA的随机森林模型能够有效提高谣言识别的准确率。
引用
收藏
页码:89 / 96
页数:8
相关论文