受限领域中文情感问答系统研究

被引:0
作者
唐琴
机构
[1] 大连理工大学
关键词
问答系统; 情感问答; 组块分析; 知网;
D O I
暂无
年度学位
2008
学位类型
硕士
导师
摘要
随着数字信息的膨胀,大量可用的数字信息对于回答用户的各种问题变成了可利用的资源。传统的信息检索通常会对用户的提问返回成百上千篇文档,而用户必须依靠自己在这些繁多而又充满重复的文档中筛选自己需要的有用信息。为了克服这些不足,近年来,越来越多的研究机构和公司致力于新一代信息检索系统的研究,其中一个很重要的方向就是问答系统。 如今大多数的问答系统对于简单的事实性问题和常问问题的回答已经达到了很高的准确率,然而偏重于观点或情感的问答系统的研究却相对较少。人们不仅想要了解既定的事实,也想了解大众或他人对于某些特别的话题、人物,或者事件所持有的观点、想法和感情。我们发现人们对于焦点人物的关注度很高。人们喜欢了解焦点人物的喜好,也想要了解别人对这些公众人物是如何看待的。本文以娱乐焦点人物的喜好以及大众对其的情感作为研究对象,从比较新颖的情感角度来对问答系统进行研究。 相对于事实性问答系统而言,观点或情感问答系统的研究除了需要考虑观点持有者及情感倾向性等与情感相关问题以外,其难点还在于答案形式更复杂更分散。本文从百度知道人工搜集了大量的情感问题,并根据情感问题的特征,统计并归纳了五大情感问题类型。问题分类模式与传统事实性问答系统不同,不能仅仅根据疑问词对其进行分类,还需要考虑到观点以及受众的反应。问题分类使用基于组块分析的CRF模型与规则相结合的情感问题分类方法。在答案抽取时结合组块识别的结果和情感的倾向性,并根据情感问题类型的不同采取不同的方法以获取答案。实验表明本文情感问答系统研究中所用方法是有效的。
引用
收藏
页数:54
共 12 条
[1]
句子相似度计算在FAQ中的应用.[A].王洋;秦兵;郑实福;.第一届学生计算语言学研讨会.2002,
[2]
基于最大熵分类器的语义角色标注 [J].
刘挺 ;
车万翔 ;
李生 .
软件学报, 2007, (03) :565-573
[3]
基于问句相似度的中文FAQ问答系统 [J].
叶正 ;
林鸿飞 ;
杨志豪 .
计算机工程与应用 , 2007, (09) :161-163+248
[4]
问答式检索技术及评测研究综述 [J].
吴友政 ;
赵军 ;
段湘煜 ;
徐波 .
中文信息学报, 2005, (03) :1-13
[5]
基于语境框架的文本相似度计算 [J].
晋耀红 .
计算机工程与应用 , 2004, (16) :36-39
[6]
网络信息检索研究综述 [J].
周丽霞 .
情报科学, 2004, (04) :395-399
[7]
基于语义依存的汉语句子相似度计算 [J].
李彬 ;
刘挺 ;
秦兵 ;
李生 .
计算机应用研究, 2003, (12) :15-17
[8]
自动问答综述 [J].
郑实福 ;
刘挺 ;
秦兵 ;
李生 .
中文信息学报, 2002, (06) :46-52
[9]
一种汉语语句依存关系网协动生成方法研究 [J].
郭艳华 ;
周昌乐 .
杭州电子工业学院学报, 2000, (04) :24-32
[10]
依存语法和机器翻译 [J].
刘海涛 .
语言文字应用, 1997, (03)