一种基于逻辑回归算法的水军识别方法

被引:10
作者
张良 [1 ]
朱湘 [1 ]
李爱平 [1 ]
王志华 [1 ]
鲁鹏 [2 ]
机构
[1] 国防科技大学计算机学院
[2] 武警乌鲁木齐指挥学院教研部
关键词
twitter; 新浪微博; CDF; 逻辑回归; 水军检测;
D O I
暂无
中图分类号
TP393.092 []; O212.1 [一般数理统计];
学科分类号
080402 ; 020208 ; 070103 ; 0714 ;
摘要
随着诸如twitter和微博等新媒体的发展,由于网络公关与营销等原因,网络水军也出现并呈现出急剧增加的态势。造成大量的网络资源和普通用户的时间遭到侵占,同时也对舆情真实性产生了重要影响。文章建立一种基于逻辑回归算法的水军识别模型,,利用累计分布函数(CDF)对对新浪微博用户行为属性以及账号属性进行分析和选取,将合适的属性包括好友数、粉丝数、文本相似度、URL率等作为输入参数,用以训练基于逻辑回归算法的分类模型,得到相应系数,从而完成对网络水军识别模型的构建。实验结果证明了模型的准确性和有效性。
引用
收藏
页码:57 / 62
页数:6
相关论文
共 4 条
[1]   微博时代网络水军在网络舆情传播中的影响效力研究——以近年来26个网络水军参与的网络事件为例 [J].
李彪 ;
郑满宁 .
国际新闻界, 2012, 34 (10) :30-36
[2]   基于相似中心的k-cmeans文本聚类算法 [J].
许厚金 ;
刘永炎 ;
邓成玉 ;
刘永山 .
计算机工程与设计, 2010, 31 (08) :1802-1805
[3]  
An evaluation of statistical spam filtering techniques[J] . Le Zhang,Jingbo Zhu,Tianshun Yao.ACM Transactions on Asian Language Information Processing (TALIP) . 2004 (4)
[4]  
WARNING BIRD:Detecting Suspicious URLs in Twitter Stream .2 Sangho Lee,Jong Kim. Network & Distributed System Security (NDSS) . 2012