基于把关人行为的微博虚假信息及早检测方法

被引:19
作者
谢柏林 [1 ,2 ]
蒋盛益 [1 ]
周咏梅 [1 ]
谢逸 [3 ]
李霞 [2 ]
机构
[1] 广东外语外贸大学思科信息学院
[2] 广东外语外贸大学语言工程与计算实验室
[3] 中山大学信息科学与技术学院
关键词
微博; 虚假信息; 把关人; 隐半马尔可夫模型; 社会媒体; 社交网络; 数据挖掘;
D O I
暂无
中图分类号
TP393.092 []; TP391.1 [文字信息处理];
学科分类号
080402 ; 081203 ; 0835 ;
摘要
目前微博已成为人们获取信息和发布信息的一个重要平台,然而微博也正成为虚假信息滋生和泛滥的温床.现有的方法主要基于分类算法来识别虚假信息,这些方法不能及早发现微博上流行的虚假信息.为了减少虚假信息对公众的影响,使微博在人们的生产和生活中发挥更积极的作用,文中提出一种基于把关人行为的微博虚假信息及早检测方法.该方法利用模型状态持续时间概率为Gamma分布的隐半马尔可夫模型来刻画信息转发者和评论者对流行的真实信息的把关行为,基于此来及早识别微博上流行的虚假信息.该方法分为模型训练和虚假信息检测两个阶段,在虚假信息检测阶段,计算每条信息在传播过程中产生的观测序列相对于模型的平均对数似然概率,实时更新每条信息的可信度,从而及早发现虚假信息,降低虚假信息的危害.使用采集的新浪微博数据集和Twitter数据集对文中的方法进行了测试,实验结果表明了该方法的有效性.
引用
收藏
页码:730 / 744
页数:15
相关论文
共 7 条
[1]   微博网络中用户特征量和增长率分布的研究 [J].
苑卫国 ;
刘云 ;
程军军 .
计算机学报, 2014, 37 (04) :767-778
[2]   基于多特征与复合分类法的中文微博情感分析 [J].
吴维 ;
肖诗斌 .
北京信息科技大学学报(自然科学版), 2013, 28 (04) :39-45
[3]   基于语义相似度的Web信息可信分析 [J].
王腾 ;
朱青 ;
王珊 .
计算机学报, 2013, 36 (08) :1668-1681
[4]   An efficient algorithm for parameterizing HsMM with Gaussian and Gamma distributions [J].
Xie, Y. ;
Tang, S. ;
Tang, C. ;
Huang, X. .
INFORMATION PROCESSING LETTERS, 2012, 112 (19) :732-737
[5]   An experimental system for measuring the credibility of news content in Twitter [J].
Al-Khalifa, Hend S. ;
Al-Eidan, Rasha M. .
INTERNATIONAL JOURNAL OF WEB INFORMATION SYSTEMS, 2011, 7 (02) :130-+
[6]  
A social network as information: The effect of system generated reports of connectedness on credibility on Twitter[J] . David Westerman,Patric R. Spence,Brandon Van Der Heide.Computers in Human Behavior . 2011 (1)
[7]  
Hidden semi-Markov models[J] . Shun-Zheng Yu.Artificial Intelligence . 2009 (2)