基于情感极性与SMOTE过采样的虚假评论识别方法

被引:48
作者
缪裕青 [1 ,2 ]
欧威健 [1 ]
刘同来 [1 ]
刘水清 [1 ]
文益民 [1 ,2 ]
机构
[1] 桂林电子科技大学计算机与信息安全学院
[2] 桂林电子科技大学广西可信软件重点实验室
关键词
虚假评论; 情感极性; 用户行为; 逻辑回归; 随机森林;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
为了有效识别商品虚假评论,提出一种基于情感极性与SMOTE过采样的虚假评论识别方法。首先,根据在线虚假评论的特点,构建一个多维虚假评论特征模型;其次,在情感极性算法中增加了情感极性均值和情感极性标准差等统计指标来全面刻画虚假评论;最后,针对虚假评论中的类不平衡问题,使用SMOTE算法优化随机森林分类模型,从而提高虚假评论识别效果。基于大众点评网的真实评论数据进行了多组实验,实验结果表明该方法在正负样本不平衡的虚假评论数据集中具有更高的准确率、召回率及F值。综合考虑情感极性和正负样本不平衡等因素可帮助电商平台有效过滤虚假评论,为消费者提供更加真实可靠的评论数据。
引用
收藏
页码:2042 / 2045
页数:4
相关论文
共 5 条
[1]
融合情感极性和逻辑回归的虚假评论检测方法 [J].
赵军 ;
王红 .
智能系统学报, 2016, 11 (03) :336-342
[2]
在线商品虚假评论形成路径研究 [J].
陈燕方 ;
娄策群 .
现代情报, 2015, 35 (01) :49-53
[3]
基于语言结构和情感极性的虚假评论识别 [J].
任亚峰 ;
尹兰 ;
姬东鸿 .
计算机科学与探索 , 2014, (03) :313-320
[4]
基于自适应聚类的虚假评论检测 [J].
宋海霞 ;
严馨 ;
余正涛 ;
石林宾 ;
苏斐 .
南京大学学报(自然科学版), 2013, 49 (04) :433-438
[5]
Detecting Spam Review through Sentiment Analysis.[J].Qingxi Peng;Ming Zhong.Journal of Software.2014, 8