基于NLP技术的中文网络评论观点抽取方法的研究

被引:0
作者
娄德成
机构
[1] 上海交通大学
关键词
语义极性; 网络评论; 句法分析; 观点抽取;
D O I
暂无
年度学位
2007
学位类型
硕士
导师
摘要
用户关于产品性能的评价,无论是对于厂家还是潜在购买者来说,都是很有研究价值的。厂家不仅需要了解对于自己产品的评价,也需要掌握有关竞争对手产品性能的反馈;而潜在购买者则希望从已经存在的评价中得到参考和建议。因此,观点抽取技术具有很大的研究价值。 而Web已经成为消费者发表评论的重要途径,比如论坛,BBS,Blog等,这些已经成为观点信息的重要来源。 但是Web上的信息是海量的,而且比较分散,如果依靠人工浏览查阅,将是一项费时而又低效的工作。于是,我们需要信息抽取技术。但是传统的信息抽取和信息检索研究的重点是针对客观表达的事实信息。 因为观点是主观性的,因此我们需要能够自动抽取主观性观点的技术,从用户评论中自动抽取出针对每个产品特征的意见,并进行语义极性分析。 语义极性分析和观点抽取是指利用计算机技术自动分析带有观点信息的句子或文档,从而提取出用户感兴趣的主题(topic)或特征(feature),并分析其语义极性倾向(褒义、贬义或中性)和强度。 目前中文领域对于语义极性分析还主要集中在词语的极性倾向判断,和文档层次的极性分析,且都是基于统计方法,没有运用复杂的自然语言处理技术对句子层次进行分析。我们将尝试利用NLP(Natural Language Processing)方法,对中文句子的语义极性倾向进行研究。 本文利用自然语言处理技术,对中文网络评论语句进行语义极性分
引用
收藏
页数:68
共 1 条
[1]
基于HowNet的词汇语义倾向计算 [J].
朱嫣岚 ;
闵锦 ;
周雅倩 ;
黄萱菁 ;
吴立德 .
中文信息学报, 2006, (01) :14-20