基于大规模评论数据的产品特征词典构建方法研究

被引:24
作者
李伟卿 [1 ,2 ]
王伟军 [2 ]
机构
[1] 华中师范大学信息管理学院
[2] 华中师范大学青少年网络心理与行为教育部重点实验室
关键词
产品评论; 特征词典; 特征提取; 观点挖掘;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
【目的】基于大规模评论数据,提出一种产品特征词典的构建方法,以提升识别产品特征的查准率和查全率。【方法】在人工标注的基础上,基于同义词林的扩展,以及大规模评论文本的词向量训练,计算词语的语义相似度和相关性,进行特征的识别与归并,进而形成产品特征词典。【结果】本文选取手机、相机、图书三类产品的评论数据进行实验,平均查准率和平均查全率分别为0.774和0.855。结果显示,该方法具有一定的普适性。【局限】标注及验证需大量人工参与,自动化程度不够;没有考虑评论中的隐含特征。【结论】通过与已有研究比较,验证了本文提出方法的有效性,特别在查全率上具有显著的提升。
引用
收藏
页码:41 / 50
页数:10
相关论文
共 16 条
[1]
基于用户偏好与商品属性情感匹配的图书个性化推荐研究 [J].
侯银秀 ;
李伟卿 ;
王伟军 ;
张婷婷 .
数据分析与知识发现, 2017, (08) :9-17
[2]
基于特征本体的微博产品评论情感分析 [J].
唐晓波 ;
兰玉婷 .
图书情报工作, 2016, (16) :121-127+136
[3]
中文评论产品特征与观点抽取方法研究 [J].
孟园 ;
王洪伟 .
现代图书情报技术, 2016, (02) :16-24
[4]
基于微博的产品评论挖掘:情感分析的方法[J] 史伟;王洪伟;何绍义; 情报学报 2014,
[5]
基于词向量的情感新词发现方法 [J].
杨阳 ;
刘龙飞 ;
魏现辉 ;
林鸿飞 .
山东大学学报(理学版), 2014, 49 (11) :51-58
[6]
网络商品评论的特征–情感词本体构建与情感分析方法研究 [J].
杜嘉忠 ;
徐健 ;
刘颖 .
现代图书情报技术, 2014, (05) :74-82
[7]
中文网络评论中提取产品特征的研究 [J].
祖李军 ;
王卫平 .
计算机系统应用, 2014, 23 (05) :196-201
[8]
《同义词词林》在中文实体关系抽取中的作用 [J].
刘丹丹 ;
彭成 ;
钱龙华 ;
周国栋 .
中文信息学报, 2014, 28 (02) :91-99
[9]
基于知网的模糊情感本体的构建研究[J] 史伟;王洪伟;何绍义; 情报学报 2012,
[10]
基于依存关系的旅游景点评论的特征—观点对抽取 [J].
王素格 ;
吴苏红 .
中文信息学报, 2012, 26 (03) :116-121