垃圾商品评论信息的识别研究

被引:33
作者
李霄
丁晟春
机构
[1] 南京理工大学信息管理系
关键词
SVM; 垃圾评论; 特征选择; 核函数; 商品评论信息;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
从信息有用性的角度对垃圾商品评论信息进行分析,选择数码领域的相机评论作为研究对象,构建数据集,从评论、评论者和被评论的商品三个方面选择11个特征,使用支持向量机模型中4种常用的核函数进行垃圾商品评论的识别,对识别效果较好的RBF核函数中的参数C和γ进行优化,使得商品评论中的垃圾评论识别的准确率提高到78.16%,召回率提高到72.18%,并选取4种不同特征组合进行对比,证明评论、评论者和被评论的商品三大特征组合的效果最好,最后通过与Logistic回归模型的对比,验证SVM对垃圾评论的识别效果明显优于其他算法。
引用
收藏
页码:63 / 68
页数:6
相关论文
共 3 条
[1]   由Logistic回归识别Web社区的垃圾评论 [J].
何海江 ;
凌云 .
计算机工程与应用 , 2009, (23) :140-143
[2]   一种适应短文本的相关测度及其应用 [J].
何海江 .
计算机工程, 2009, 35 (06) :88-90+96
[3]  
管理学.[M].周三多等编著;.复旦大学出版社.1999,