电子商务中垃圾评论检测的特征提取方法

被引:14
作者
游贵荣 [1 ,2 ]
吴为 [3 ]
钱沄涛 [2 ]
机构
[1] 福建商业高等专科学校信息管理工程系
[2] 浙江大学计算机科学与技术学院
[3] 浙江省网络系统与信息安全重点实验室
关键词
意见挖掘; 特征提取; 垃圾评论;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
【目的】针对电子商务中产品评论存在较多垃圾评论的问题,提出新的特征提取方法,提高垃圾评论的识别率。【方法】根据量化评价的思想,使用词性路径匹配模板检测评论中的评价句,并在分词中加入自定义评价词词典,提高评价句的识别率。利用评价句的数量能够很好地区分与产品无关的评论或垃圾评论的优点,结合评论的主题词、情感倾向、文本结构等,有针对性地提取相应的特征。【结果】实验结果显示,利用该特征识别垃圾评论的准确率为97.96%、F值为88.48%。【局限】该方法主要用于中文垃圾评论的识别,不适用于英文产品评论。【结论】所提取的特征能够高效准确地识别垃圾评论,亦可用于正常评论的有用性量化评估及排序,有广泛的应用价值。
引用
收藏
页码:93 / 100
页数:8
相关论文
共 8 条
[1]   基于用户评论挖掘的产品推荐算法 [J].
扈中凯 ;
郑小林 ;
吴亚峰 ;
陈德人 .
浙江大学学报(工学版), 2013, 47 (08) :1475-1485
[2]   垃圾商品评论信息的识别研究 [J].
李霄 ;
丁晟春 .
现代图书情报技术, 2013, (01) :63-68
[3]   基于词性分析的产品评价信息挖掘 [J].
冯秀珍 ;
郝鹏 .
计算机工程与设计, 2013, 34 (01) :283-288
[4]   基于句法树结构的情感评价单元抽取算法 [J].
黄亿华 ;
濮小佳 ;
袁春风 ;
武港山 .
计算机应用研究, 2011, 28 (09) :3229-3234
[5]   中文网络客户评论的产品特征挖掘方法研究 [J].
李实 ;
叶强 ;
李一军 ;
Rob Law .
管理科学学报, 2009, (02) :142-152
[6]  
产品描述词及情感词抽取模式的研究[D]. 赵文婧.北京邮电大学 2010
[7]  
Quality evaluation of product reviews using an information quality framework[J] . Chien Chin Chen,You-De Tseng.Decision Support Systems . 2010 (4)
[8]  
酷酷词. http://www.kukuci.com . 2013