基于语义资源的文本情感计算

被引:0
作者
徐琳宏
机构
[1] 大连理工大学
关键词
情感计算; 条件随机域; 本体; 认知语境;
D O I
暂无
年度学位
2007
学位类型
硕士
导师
摘要
情感计算是人工智能的一个热门研究领域,它的目标是使计算机拥有情感,能够像人一样自然亲切的交流。随着Internet的发展,以文本形式出现的信息越来越多,逐渐成为我们最容易获取也是最为丰富的一种交互资源,然而在国内文本情感分析方面的研究较少。所以本文首先构建情感识别所需的语义资源,情感词汇本体和情感语料库,在此基础上采用了基于语义特征和基于认知-评价理论的两种方法识别文本中每句的情感类别。 在语义资源的建设中,首先根据目前情感分类发展的现状,确定情感分类体系。然后通过手工分类和自动获取相结合的方法填充词汇本体的描述框架。情感语料库构建中讨论了制定标注规范、选择标注集、设计标注工具以及标注过程中的质量监控等问题。目前已经标注完成近四万句,一百万字的语料。在完成这些已标注语料的基础上,进一步给出了语料库的情感分布,情感迁移规律等统计数据,分析了情感语料库的特点及应用。 基于语义特征的情感识别方法是将句子中词汇的情感信息和语义特征加入条件随机域(CRFs)中,生成文章的情感链。而基于认知-评价理论的情感识别是以拉扎勒斯的认知-评价理论和认知语用学中的认知语境为理论背景,从情感的发生机制出发,以多种情感图式为基础的一个文本情感认知模型。最后本文采用单句评估法和多句联合评估法两种不同的方法,分别评测两种识别方法的正确率和情感的连贯性。 实验证明基于语义特征的方法在情感的连贯性上效果较好,而基于认知的方法总体准确率较高。两种方法分别从不同的角度对文本情感识别做了初步探索,具有进一步研究的价值。
引用
收藏
页数:52
共 22 条
[1]
心理学导论.[M].梁宁建主编.上海教育出版社.2006,
[2]
新世纪汉语新词词典.[M].王均熙编著;.汉语大词典出版社.2006,
[3]
汉语熟语词典.[M].王发国等编写;杨兴发主编;.四川辞书出版社.2005,
[4]
情绪心理学.[M].孟昭兰主编;.北京大学出版社.2005,
[5]
统计自然语言处理基础.[M].(美)ChristopherD.Manning;(德)HinrichSchutze著;苑春法等译;.电子工业出版社.2005,
[6]
中华成语大词典.[M].程志强等编.中国大百科全书出版社.2003,
[7]
汉语形容词用法词典.[M].郑怀德;孟庆海编;.商务印书馆.2003,
[8]
汉语褒贬义词语用法词典.[M].DonStarr(司马麟)译;王国璋主编;.华语教学出版社.2001,
[9]
现代汉语句子.[M].陈昌来著;张斌主编;.华东师范大学出版社.2000,
[10]
现代汉语虚词.[M].张斌主编;张谊生著;.华东师范大学出版社.2000,