融合情感极性和逻辑回归的虚假评论检测方法

被引:16
作者
赵军 [1 ,2 ]
王红 [1 ,2 ]
机构
[1] 山东师范大学信息科学与工程学院
[2] 山东省分布式计算软件新技术重点实验室
关键词
电子商务; 虚假评论; 购物行为; 情感极性; 逻辑回归;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; F724.6 [电子贸易、网上贸易];
学科分类号
1201 ;
摘要
在线购物评论为消费者比较商品的质量和其他一些购买特性提供了有用信息,然而却有大量的虚假评论者受利益驱使撰写虚假或者不公正的评论来迷惑消费者。先前的研究一般都是使用文本相似度和评分模式来探测虚假评论,这些算法可以检测特定类型的攻击者,在现实场景中许多虚假评论者刻意模仿正常用户对商品进行评论,因此先前的算法对检测这类攻击效果不佳。本文通过分析评论文本的感情极性,抽取不同的特征并使用逻辑回归模型来检测虚假评论;首先,借用自然语言处理的相关技术来分析评论文本的情感极性,判断每个用户的情感偏离大众情感的程度,如果偏离越大则说明其是虚假评论者的概率就越大;然后再选取其他几个重要特征结合逻辑回归模型进行虚假检测;通过实验对比,表明了该方法取得了较好的效果。
引用
收藏
页码:336 / 342
页数:7
相关论文
共 9 条
[1]   基于转折句式的文本情感倾向性分析 [J].
邸鹏 ;
李爱萍 ;
段利国 .
计算机工程与设计, 2014, 35 (12) :4289-4295
[2]   微博新词发现及情感倾向判断分析 [J].
唐波 ;
陈光 ;
王星雅 ;
王非 ;
陈小慧 .
山东大学学报(理学版), 2015, 50 (01) :20-25
[3]   基于语言结构和情感极性的虚假评论识别 [J].
任亚峰 ;
尹兰 ;
姬东鸿 .
计算机科学与探索, 2014, 8 (03) :313-320
[4]   垃圾评论自动过滤方法 [J].
谭文堂 ;
朱洪 ;
葛斌 ;
李芳芳 ;
肖卫东 .
国防科技大学学报, 2012, 34 (05) :153-157+168
[5]   基于语义理解的中文博文倾向性分析 [J].
何凤英 .
计算机应用, 2011, 31 (08) :2130-2133+2137
[6]   Group-based ranking method for online rating systems with spamming attacks [J].
Gao, Jian ;
Dong, Yu-Wei ;
Shang, Ming-Sheng ;
Cai, Shi-Min ;
Zhou, Tao .
EPL, 2015, 110 (02)
[7]   Identify Online Store Review Spammers via Social Review Graph [J].
Wang, Guan ;
Xie, Sihong ;
Liu, Bing ;
Yu, Philip S. .
ACM TRANSACTIONS ON INTELLIGENT SYSTEMS AND TECHNOLOGY, 2012, 3 (04)
[8]   Opinion Formation Under Costly Expression [J].
Wu, Fang ;
Huberman, Bernardo A. .
ACM TRANSACTIONS ON INTELLIGENT SYSTEMS AND TECHNOLOGY, 2010, 1 (01)
[9]  
Finding unusual review patterns using unexpected rules .2 Nitin Jindal,Bing Liu,Ee-Peng Lim. Proceedings of the 19th ACM international conference on Information and knowledge management . 2010