学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于大规模评论数据的产品特征词典构建方法研究
被引:24
作者
:
论文数:
引用数:
h-index:
机构:
李伟卿
[
1
,
2
]
论文数:
引用数:
h-index:
机构:
王伟军
[
2
]
机构
:
[1]
华中师范大学信息管理学院
[2]
华中师范大学青少年网络心理与行为教育部重点实验室
来源
:
数据分析与知识发现
|
2018年
/ 01期
关键词
:
产品评论;
特征词典;
特征提取;
观点挖掘;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
【目的】基于大规模评论数据,提出一种产品特征词典的构建方法,以提升识别产品特征的查准率和查全率。【方法】在人工标注的基础上,基于同义词林的扩展,以及大规模评论文本的词向量训练,计算词语的语义相似度和相关性,进行特征的识别与归并,进而形成产品特征词典。【结果】本文选取手机、相机、图书三类产品的评论数据进行实验,平均查准率和平均查全率分别为0.774和0.855。结果显示,该方法具有一定的普适性。【局限】标注及验证需大量人工参与,自动化程度不够;没有考虑评论中的隐含特征。【结论】通过与已有研究比较,验证了本文提出方法的有效性,特别在查全率上具有显著的提升。
引用
收藏
页码:41 / 50
页数:10
相关论文
共 16 条
[1]
基于用户偏好与商品属性情感匹配的图书个性化推荐研究
[J].
侯银秀
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学信息管理学院
侯银秀
;
李伟卿
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学信息管理学院
李伟卿
;
王伟军
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学信息管理学院
王伟军
;
张婷婷
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学信息管理学院
张婷婷
.
数据分析与知识发现,
2017,
(08)
:9
-17
[2]
基于特征本体的微博产品评论情感分析
[J].
论文数:
引用数:
h-index:
机构:
唐晓波
;
论文数:
引用数:
h-index:
机构:
兰玉婷
.
图书情报工作,
2016,
(16)
:121
-127+136
[3]
中文评论产品特征与观点抽取方法研究
[J].
论文数:
引用数:
h-index:
机构:
孟园
;
论文数:
引用数:
h-index:
机构:
王洪伟
.
现代图书情报技术,
2016,
(02)
:16
-24
[4]
基于微博的产品评论挖掘:情感分析的方法[J] 史伟;王洪伟;何绍义; 情报学报 2014,
[5]
基于词向量的情感新词发现方法
[J].
论文数:
引用数:
h-index:
机构:
杨阳
;
论文数:
引用数:
h-index:
机构:
刘龙飞
;
论文数:
引用数:
h-index:
机构:
魏现辉
;
论文数:
引用数:
h-index:
机构:
林鸿飞
.
山东大学学报(理学版),
2014,
49
(11)
:51
-58
[6]
网络商品评论的特征–情感词本体构建与情感分析方法研究
[J].
论文数:
引用数:
h-index:
机构:
杜嘉忠
;
论文数:
引用数:
h-index:
机构:
徐健
;
论文数:
引用数:
h-index:
机构:
刘颖
.
现代图书情报技术,
2014,
(05)
:74
-82
[7]
中文网络评论中提取产品特征的研究
[J].
论文数:
引用数:
h-index:
机构:
祖李军
;
王卫平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学管理学院
王卫平
.
计算机系统应用,
2014,
23
(05)
:196
-201
[8]
《同义词词林》在中文实体关系抽取中的作用
[J].
刘丹丹
论文数:
0
引用数:
0
h-index:
0
机构:
苏州大学自然语言处理实验室
刘丹丹
;
论文数:
引用数:
h-index:
机构:
彭成
;
钱龙华
论文数:
0
引用数:
0
h-index:
0
机构:
苏州大学自然语言处理实验室
钱龙华
;
周国栋
论文数:
0
引用数:
0
h-index:
0
机构:
苏州大学自然语言处理实验室
周国栋
.
中文信息学报,
2014,
28
(02)
:91
-99
[9]
基于知网的模糊情感本体的构建研究[J] 史伟;王洪伟;何绍义; 情报学报 2012,
[10]
基于依存关系的旅游景点评论的特征—观点对抽取
[J].
论文数:
引用数:
h-index:
机构:
王素格
;
论文数:
引用数:
h-index:
机构:
吴苏红
.
中文信息学报,
2012,
26
(03)
:116
-121
←
1
2
→
共 16 条
[1]
基于用户偏好与商品属性情感匹配的图书个性化推荐研究
[J].
侯银秀
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学信息管理学院
侯银秀
;
李伟卿
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学信息管理学院
李伟卿
;
王伟军
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学信息管理学院
王伟军
;
张婷婷
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学信息管理学院
张婷婷
.
数据分析与知识发现,
2017,
(08)
:9
-17
[2]
基于特征本体的微博产品评论情感分析
[J].
论文数:
引用数:
h-index:
机构:
唐晓波
;
论文数:
引用数:
h-index:
机构:
兰玉婷
.
图书情报工作,
2016,
(16)
:121
-127+136
[3]
中文评论产品特征与观点抽取方法研究
[J].
论文数:
引用数:
h-index:
机构:
孟园
;
论文数:
引用数:
h-index:
机构:
王洪伟
.
现代图书情报技术,
2016,
(02)
:16
-24
[4]
基于微博的产品评论挖掘:情感分析的方法[J] 史伟;王洪伟;何绍义; 情报学报 2014,
[5]
基于词向量的情感新词发现方法
[J].
论文数:
引用数:
h-index:
机构:
杨阳
;
论文数:
引用数:
h-index:
机构:
刘龙飞
;
论文数:
引用数:
h-index:
机构:
魏现辉
;
论文数:
引用数:
h-index:
机构:
林鸿飞
.
山东大学学报(理学版),
2014,
49
(11)
:51
-58
[6]
网络商品评论的特征–情感词本体构建与情感分析方法研究
[J].
论文数:
引用数:
h-index:
机构:
杜嘉忠
;
论文数:
引用数:
h-index:
机构:
徐健
;
论文数:
引用数:
h-index:
机构:
刘颖
.
现代图书情报技术,
2014,
(05)
:74
-82
[7]
中文网络评论中提取产品特征的研究
[J].
论文数:
引用数:
h-index:
机构:
祖李军
;
王卫平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学管理学院
王卫平
.
计算机系统应用,
2014,
23
(05)
:196
-201
[8]
《同义词词林》在中文实体关系抽取中的作用
[J].
刘丹丹
论文数:
0
引用数:
0
h-index:
0
机构:
苏州大学自然语言处理实验室
刘丹丹
;
论文数:
引用数:
h-index:
机构:
彭成
;
钱龙华
论文数:
0
引用数:
0
h-index:
0
机构:
苏州大学自然语言处理实验室
钱龙华
;
周国栋
论文数:
0
引用数:
0
h-index:
0
机构:
苏州大学自然语言处理实验室
周国栋
.
中文信息学报,
2014,
28
(02)
:91
-99
[9]
基于知网的模糊情感本体的构建研究[J] 史伟;王洪伟;何绍义; 情报学报 2012,
[10]
基于依存关系的旅游景点评论的特征—观点对抽取
[J].
论文数:
引用数:
h-index:
机构:
王素格
;
论文数:
引用数:
h-index:
机构:
吴苏红
.
中文信息学报,
2012,
26
(03)
:116
-121
←
1
2
→