文本的情感倾向分析研究

被引:0
作者
宋光鹏
机构
[1] 北京邮电大学
关键词
自然语言理解; 语义分析; 情感倾向; 文本分类;
D O I
暂无
年度学位
2008
学位类型
硕士
导师
摘要
对文本中的情感因素进行分析,是现在自然语言处理中比较活跃的一个领域,其目的是判断一篇文章对评价对象所持有的情感倾向是支持还是反对。它可以广泛应用在文本检索、文本过滤等领域中,而且这种需求也越来越受到各个方面的重视。对文本中的情感进行量化,可以为很多研究提供情感数据,从而衍生出更多对情感方面的应用。本文的主要研究工作和成果有: 1、针对中文文本的情感倾向进行评估,基于自然语言理解的方法,提出了一种基于语义的文本倾向性算法,通过句子中局部能表达情感倾向的词和评价对象组合成短语,以此来代替句子的语法结构,从中分析出其蕴含的语义。通过测试,在文本情感语义特征的抽取上,利用这些句中的短语基本土能表达出句子的情感倾向,并满足分类的要求。而且使用这种算法,分析的时空效率较高,能达到实际应用的需求。通过试验,该算法对特定领域的文章分类查准率达到了89.8%,查全率达到了93.5%。 2、从文本中词和短语的分析着手,提出了基于情感倾向性判断的文本情感分类算法。该算法通过分析文本中的情感词以及由这些情感词构造的短语模式,作为文本的情感特征,并利用这些特征实现文本的情感判别。该算法改善了以往基于统计的情感判别算法因缺乏语义上的约束而在情感倾向判别上的不足。 3、本文提出的情感倾向算法主要包括情感词汇的选取、情感词词典的标识、句子结构分析和文本情感倾向值判断。算法通过分词、标注、抽取有效的短语、计算文本情感倾向值等步骤实现。
引用
收藏
页数:65
共 24 条
[1]
Annotating Expressions of Opinions and Emotions in Language.[J].Janyce Wiebe;Theresa Wilson;Claire Cardie.Language Resources and Evaluation.2006, 2-3
[2]
Measuring praise and criticism.[J].Peter D. Turney;Michael L. Littman.ACM Transactions on Information Systems (TOIS).2003, 4
[3]
基于多重标记CRF的句子情感分析研究..王根;赵军;.全国第九届计算语言学学术会议.2007,
[4]
新资源、新思路、新技术——知网的近期发展和应用..董振东;.全国第五届计算语言学联合学术会议特邀发言.1999,
[5]
拟人控制系统的概念与体系 [J].
白凤双 ;
尹怡欣 ;
涂序彦 ;
张迎 .
微计算机信息, 2006, (10) :1-3+34
[6]
一种具有人工情感的智能控制系统研究 [J].
宁淑荣 ;
涂序彦 .
微计算机信息, 2006, (01) :19-21
[7]
汉语自动分词的研究现状与困难 [J].
张春霞 ;
郝天永 .
系统仿真学报, 2005, (01) :138-143+147
[8]
基于VSM的中文文本分类系统的设计与实现 [J].
张东礼 ;
汪东升 ;
郑纬民 .
清华大学学报(自然科学版), 2003, (09) :1288-1291
[9]
汉语情感意义的机器标注研究初探 [J].
应英 ;
周锋 ;
周昌乐 .
中文信息学报, 2002, (02) :27-33
[10]
统计语言模型能做什么? [J].
黄昌宁 .
语言文字应用, 2002, (01) :77-84