面向特定领域的产品评价对象自动识别研究

被引:32
作者
宋晓雷 [1 ]
王素格 [1 ,2 ]
李红霞 [1 ]
机构
[1] 山西大学数学科学学院
[2] 山西大学计算智能与中文信息处理教育部重点实验室
关键词
计算机应用; 中文信息处理; 产品评价对象; 产品名称; 产品属性; 模板; K均值聚类; 双向Bootstrapping方法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
产品评价对象的自动识别是文本观点信息抽取和倾向性分析中的重要研究课题之一。该文针对汽车评论,提出了一种不依赖外部资源的无指导评价对象自动识别方法。该方法首先综合使用词形模板和词性模板,采用模糊匹配方法和剪枝法抽取候选评价对象。然后,从候选对象集中,采用双向Bootstrapping方法识别出产品评价对象。最后,通过采用K均值聚类方法对产品评价对象进行聚类,实现从评价对象中自动抽取产品名称和产品属性。实验结果表明,该方法对产品评价对象识别的F值达到58.5%,产品名称识别的F值达到69.48%。
引用
收藏
页码:89 / 93
页数:5
相关论文
共 4 条
[1]   一种基于主题的文本聚类方法 [J].
赵世奇 ;
刘挺 ;
李生 .
中文信息学报, 2007, (02) :58-62
[2]   面向商务信息抽取的产品命名实体识别研究 [J].
刘非凡 ;
赵军 ;
吕碧波 ;
徐波 ;
于浩 ;
夏迎炬 .
中文信息学报, 2006, (01) :7-13
[3]  
Unsupervised named-entity extraction from the Web: An experimental study[J] . Oren Etzioni,Michael Cafarella,Doug Downey,Ana-Maria Popescu,Tal Shaked,Stephen Soderland,Daniel S. Weld,Alexander Yates.Artificial Intelligence . 2005 (1)
[4]   Learning subjective language [J].
Wiebe, J ;
Wilson, T ;
Bruce, R ;
Bell, M ;
Martin, M .
COMPUTATIONAL LINGUISTICS, 2004, 30 (03) :277-308