基于自适应聚类的虚假评论检测

被引:34
作者
宋海霞 [1 ]
严馨 [1 ]
余正涛 [1 ]
石林宾 [1 ]
苏斐 [2 ]
机构
[1] 昆明理工大学信息工程与自动化学院
[2] 中国石油信息技术服务中心
关键词
虚假评论; 自适应聚类; 异常簇; F统计量;
D O I
10.13232/j.cnki.jnju.2013.04.005
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
借助评论者的行为特性,提出一种基于评论者行为特征的自适应聚类的虚假评论检测方法.首先,根据评论数据定义自身基本特征以及与其他评论之间的关联性特征,并对每维特征进行归一化处理;其次,根据每一条评论的特征构建聚类矩阵,利用F统计量对K均值算法进行改进,实现评论数据的自适应聚类;最后,计算每个簇偏离整个评论数据集的程度,根据阈值确定异常簇,从而实现虚假评论检测.利用领域评论数据进行实验,结果表明基于自适应聚类的虚假评论检测方法取得了较好的效果.
引用
收藏
页码:433 / 438
页数:6
相关论文
共 7 条
[1]   垃圾评论自动过滤方法 [J].
谭文堂 ;
朱洪 ;
葛斌 ;
李芳芳 ;
肖卫东 .
国防科技大学学报, 2012, 34 (05) :153-157+168
[2]   最小最大模块化网络中基于聚类的数据划分方法研究 [J].
解晓敏 ;
李云 .
南京大学学报(自然科学版), 2012, 48 (02) :133-139
[3]   用户生成内容中的垃圾意见研究综述 [J].
杨风雷 ;
黎建辉 .
计算机应用研究, 2011, 28 (10) :3601-3605
[4]   文本情感分析 [J].
赵妍妍 ;
秦兵 ;
刘挺 .
软件学报, 2010, 21 (08) :1834-1848
[5]  
基于改进模糊C均值的入侵检测算法及应用研究[D]. 邓青.辽宁工程技术大学 2011
[6]   Identify Online Store Review Spammers via Social Review Graph [J].
Wang, Guan ;
Xie, Sihong ;
Liu, Bing ;
Yu, Philip S. .
ACM TRANSACTIONS ON INTELLIGENT SYSTEMS AND TECHNOLOGY, 2012, 3 (04)
[7]  
Review Spam Detection via Temporal Pattern Discovery. Sihong Xie,Guan Wang,Shuyang Lin, et al. Proceedings of the 21st international conference companion on World Wide Web . 2012