共 7 条
基于SVM的新浪微博营销类水帖识别研究
被引:5
作者:
叶施仁
孙宁
机构:
[1] 常州大学信息科学与工程学院
来源:
关键词:
评论行为;
评论特征;
支持向量机;
水帖识别;
D O I:
10.13715/j.cnki.nsjxu.2015.04.013
中图分类号:
TP393.092 [];
TP391.1 [文字信息处理];
学科分类号:
080402 ;
081203 ;
0835 ;
摘要:
研究一种发现水帖的分类算法.该方法利用SimHash方法将发帖重复当成类似网页去重的问题处理,发帖内容的重复度和其他特征,如发帖的密集型、帐号名称的相似性,所使用的客户端等特征将用于水帖与正常发帖的分类.该文利用新浪微博API下载多个汽车营销账号下的交互数据作为实验数据,并使用SVM作为分类器.实验结果表明,该方法能够较好地发现那些伪装性非常好的水军所发布的水帖.
引用
收藏
页码:70 / 74
页数:5
相关论文