产品评论特征及观点抽取研究

被引:11
作者
郗亚辉 [1 ,2 ]
机构
[1] 天津大学管理与经济学部
[2] 河北大学数学与计算机学院
关键词
产品评论挖掘; 产品特征和观点抽取; 双向传播; HITS算法; 模式相关性;
D O I
暂无
中图分类号
F724.6 [电子贸易、网上贸易];
学科分类号
1201 ;
摘要
随着电子商务的飞速发展,电子商务网站上各种产品的评论数量也在飞速地增长。如何从Web中大量存在的产品评论中挖掘出对消费者和生产厂商都有价值的信息,已经成为一个非常重要的研究领域。产品特征及观点的抽取是产品评论挖掘中的基本工作,其质量的好坏直接决定着后续工作的效果。双向传播算法能有效地抽取产品评论中的特征及观点,但对中文产品评论仍存在一些不足。本文对双向传播算法做了进一步的改进,提高了在中文产品评论中特征及观点抽取的准确率和召回率。首先,增加了两种产品特征和观点的间接句法依存关系模式,并引入了动词产品特征以增加召回率;其次,将产品特征和观点之间的句法依存关系模式作为HUB节点,利用HITS算法对候选产品特征和观点排序,从而提高准确率;最后,提出了模式相关性对最终抽取的产品特征进行优化,进一步提高了产品特征抽取的准确率。实验结果表明,本文的算法在不同产品评论的特征及观点抽取中都取得了较好的效果。
引用
收藏
页码:326 / 336
页数:11
相关论文
共 4 条
[1]   网络用户评论在企业竞争情报研究中的应用 [J].
周珍妮 ;
黄晓斌 .
情报理论与实践, 2012, 35 (05) :15-20
[2]   基于浅层句法特征的评价对象抽取研究 [J].
徐冰 ;
赵铁军 ;
王山雨 ;
郑德权 .
自动化学报, 2011, 37 (10) :1241-1247
[3]   观点挖掘在竞争对手分析中的应用 [J].
黄晓斌 ;
周珍妮 .
情报资料工作, 2010, (05) :89-93
[4]   中文网络客户评论的产品特征挖掘方法研究 [J].
李实 ;
叶强 ;
李一军 ;
Rob Law .
管理科学学报, 2009, (02) :142-152