基于LDA和随机森林的微博谣言识别研究——以2016年雾霾谣言为例

被引:60
作者
曾子明 [1 ,2 ]
王婧 [1 ,2 ]
机构
[1] 武汉大学信息资源研究中心
[2] 武汉大学图书情报实验教学中心
关键词
微博; 谣言识别; LDA; 随机森林; 雾霾;
D O I
暂无
中图分类号
G206 [传播理论]; G254 [文献标引与编目];
学科分类号
050302 ; 1205 ; 120501 ;
摘要
网络谣言的肆虐对人们的日常生活和社会稳定造成了较为严重的负面影响,为了辅助网络谣言管控的有效推进,本文以2016年雾霾谣言为例,根据微博数据和以往研究定义了用户可信度和微博影响力特征变量,采用LDA主题模型深入挖掘微博文本的主题分布特征,并基于以上特征变量采用随机森林算法进行谣言识别的模型训练。实验表明,LDA提取的文档-主题分布特征在谣言识别中发挥了重要作用,且基于LDA的随机森林模型能够有效提高谣言识别的准确率。
引用
收藏
页码:89 / 96
页数:8
相关论文
共 18 条
[1]   社交媒体中的谣言识别研究综述 [J].
刘雅辉 ;
靳小龙 ;
沈华伟 ;
鲍鹏 ;
程学旗 .
计算机学报, 2018, 41 (07) :1536-1558
[2]   基于多标签双词主题模型的短文本谣言分析研究 [J].
武庆圆 ;
何凌南 .
情报杂志, 2017, 36 (03) :92-97
[3]   复杂社会网络上的谣言传播模型研究综述 [J].
李丹丹 ;
马静 .
情报理论与实践, 2016, (12) :130-134
[4]   微信谣言的主题与特征 [J].
张志安 ;
束开荣 ;
何凌南 .
新闻与写作, 2016, (01) :60-64
[5]   中文社交媒体谣言统计语义分析 [J].
刘知远 ;
张乐 ;
涂存超 ;
孙茂松 .
中国科学:信息科学, 2015, 45 (12) :1536-1546
[6]   基于OSN的谣言传播模型及影响力节点研究 [J].
蒙在桥 ;
傅秀芬 ;
陈培文 ;
陆靖桥 .
复杂系统与复杂性科学, 2015, 12 (03) :45-52
[7]   谣言研究综述:基于媒介演变的视角 [J].
闵庆飞 ;
刘晓丹 .
情报杂志, 2015, 34 (04) :104-109
[8]   集成随机森林的分类模型 [J].
邓生雄 ;
雒江涛 ;
刘勇 ;
王小平 ;
杨军超 .
计算机应用研究, 2015, 32 (06) :1621-1624+1629
[9]   基于综合指数和熵值法的微博水军自动识别 [J].
袁旭萍 ;
王仁武 ;
翟伯荫 .
情报杂志, 2014, 33 (07) :176-179
[10]   支持向量机理论及算法研究综述 [J].
汪海燕 ;
黎建辉 ;
杨风雷 .
计算机应用研究, 2014, 31 (05) :1281-1286