基于SVM的新浪微博营销类水帖识别研究

被引:5
作者
叶施仁
孙宁
机构
[1] 常州大学信息科学与工程学院
关键词
评论行为; 评论特征; 支持向量机; 水帖识别;
D O I
10.13715/j.cnki.nsjxu.2015.04.013
中图分类号
TP393.092 []; TP391.1 [文字信息处理];
学科分类号
080402 ; 081203 ; 0835 ;
摘要
研究一种发现水帖的分类算法.该方法利用SimHash方法将发帖重复当成类似网页去重的问题处理,发帖内容的重复度和其他特征,如发帖的密集型、帐号名称的相似性,所使用的客户端等特征将用于水帖与正常发帖的分类.该文利用新浪微博API下载多个汽车营销账号下的交互数据作为实验数据,并使用SVM作为分类器.实验结果表明,该方法能够较好地发现那些伪装性非常好的水军所发布的水帖.
引用
收藏
页码:70 / 74
页数:5
相关论文
共 7 条
[1]   基于simhash的密文同义词检索方法 [J].
罗文俊 ;
孙志蔚 .
武汉大学学报(理学版), 2014, 60 (05) :459-465
[2]   网络水军识别研究 [J].
莫倩 ;
杨珂 .
软件学报, 2014, 25 (07) :1505-1526
[3]   基于支持向量机的垃圾信息过滤方法 [J].
谷文成 ;
柴宝仁 ;
韩俊松 .
北京理工大学学报, 2013, 33 (10) :1062-1066+1071
[4]   基于评论行为的商品垃圾评论的识别研究 [J].
孙升芸 ;
田萱 ;
何军 .
计算机工程与设计, 2012, 33 (11) :4314-4319
[5]   基于多SimHash指纹的近似文本检测 [J].
董博 ;
郑庆华 ;
宋凯磊 ;
田锋 ;
马瑞 .
小型微型计算机系统, 2011, 32 (11) :2152-2157
[6]   一种应用于博客的垃圾评论识别方法 [J].
邓冰娜 ;
王煜 ;
刘宇 .
郑州大学学报(理学版), 2011, 43 (01) :65-69+74
[7]   文本情感分析 [J].
赵妍妍 ;
秦兵 ;
刘挺 .
软件学报, 2010, 21 (08) :1834-1848