中文网络评论中提取产品特征的研究

被引:25
作者
祖李军
王卫平
机构
[1] 中国科学技术大学管理学院
关键词
特征抽取; 网络评论; PMI; 语言规则; 文本挖掘;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
大量的网络评论已经成为挖掘用户意见、改进产品质量的重要信息来源,而特征抽取作为后续分析的基础,直接影响到最终意见挖掘结果的准确性.本文提出了一种PMI-Bootstrapping算法,并结合了语言规则实现中文网络评论的产品特征抽取.首先利用语言规则产生候选特征集,计算每个候选特征与初始给定种子集的加权平均互信息,将满足阈值的候选特征添加到种子集中,如此循环迭代,直到种子集合收敛,输出排队后的种子集合作为抽取结果.实验证明,该算法取得良好的准确率和召回率.
引用
收藏
页码:196 / 201
页数:6
相关论文
共 4 条
[1]
基于观点挖掘的产品可用性建模与评价 [J].
易力 ;
王丽亚 .
计算机工程, 2012, 38 (16) :270-274
[2]
互联网商品评论情感分析研究综述 [J].
张紫琼 ;
叶强 ;
李一军 .
管理科学学报, 2010, (06) :84-96
[3]
中文网络客户评论的产品特征挖掘方法研究 [J].
李实 ;
叶强 ;
李一军 ;
Rob Law .
管理科学学报, 2009, 12 (02) :142-152
[4]
产品评论挖掘研究综述 [J].
伍星 ;
何中市 ;
黄永文 .
计算机工程与应用 , 2008, (36) :37-41