基于文本内容特征选择的评论质量检测

被引:5
作者
孟园
王洪伟
机构
[1] 同济大学经济与管理学院
关键词
评论质量; 信息特征; 情感倾向; 内容特征; 贪婪式特征选择;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
【目的】在有效提取多维特征基础上,考察评论内容特征对评论质量检测的影响。【方法】基于评论文本的信息特征度量和情感倾向的混合性,量化并抽取评论内容特征,采用GBDT模型评估特征集合分类效果,结合贪婪式特征选择算法识别有效内容特征,分析其对评论质量检测的影响。【结果】将评论内容特征应用于评论质量检测任务中能取得较好的效果,明显提升了实验准确率和召回率。【局限】实验对象主要是搜索型产品的评论数据,未对其他享受型产品(如电影、音乐)等进行验证和比较。【结论】评论内容的信息增益、产品特征词的信息增益、评论客观情感倾向度、内容差异性对评论质量检测有明显作用。
引用
收藏
页码:40 / 47
页数:8
相关论文
共 11 条