基于评论行为的商品垃圾评论的识别研究

被引:9
作者
孙升芸 [1 ,2 ]
田萱 [2 ]
何军 [1 ]
机构
[1] 中国人民大学信息学院
[2] 北京林业大学信息学院
关键词
商品评论; 垃圾评论; 垃圾评论识别; 垃圾评论员; 评论行为;
D O I
10.16208/j.issn1000-7024.2012.11.069
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
为了识别商品垃圾评论,基于垃评论员发表的多为垃圾评论这一基本思想,提出一种基于评论员评论行为来判定其是否为垃圾评论员的方法。分析定义了垃圾评论员常见的三类评论行为,分别是针对同类商品发表垃圾评论,针对同品牌商品发表垃圾评论和针对同一卖家商品发表垃圾评论;在对这三类评论行为建模的同时提出一种依据重复性过高或过低打分的评论数量来计算评论员垃圾指数(spam score)的方法。实验数据为在当当网摄影摄像商品区发表过评论的评论员的所有评论信息。实验结果通过人工评判和计算NDCG(normalize discounted cumulative gain)值的方法来检验,实验结果准确有效。
引用
收藏
页码:4314 / 4319
页数:6
相关论文
共 1 条
[1]   现状和设想——试论中文信息处理与现代汉语研究 [J].
许嘉璐 .
中文信息学报, 2001, (02) :1-8