中文自动问答系统研究

被引:0
作者
蔡刚山
机构
[1] 华中科技大学
关键词
问答系统; 本地知识库; 搜索引擎; 句法分析;
D O I
暂无
年度学位
2007
学位类型
硕士
摘要
随着互联网的快速发展,为人们提供了丰富的信息资源。利用搜索引擎可以帮助人们搜索自己想要的信息,但是目前的搜索引擎存在一些缺点,并不能满足人们方便、快速、准确地获取信息的需要。自动问答系统正是为了满足人们的这种愿望而发展起来的,它通过采用自然语言处理技术,用简洁准确的语言回答用户用自然语言提出的问题。 自动问答系统的研究受到国内外很多科研机构的重视,已经开发出相对成熟的英文自动问答系统,但是参与中文自动问答系统研究的科研机构还不是很多,而且还没有出现成熟的中文自动问答系统。本文对中文自动问答系统的研究进行了一些探索,希望能够促进中文自动问答技术的发展。 本文中提出的中文自动问答系统主要包括三个组成部分:问题理解、信息检索和答案抽取。首先利用问题理解对用户提交的问题进行处理,掌握用户的提问意图。问题理解包括:词法分析、问题分类、句法分析、关键词提取和扩展。信息检索则是利用问题理解中产生的检索关键词,首先从本地知识库检索相关的答案,或进一步利用多个搜索引擎从网络上获取相关的网页文档交给答案抽取模块进行处理。利用网络资源构建大规模的本地知识库。答案抽取模块对搜索引擎检索获取的网页文档进行处理,通过句子过滤、实体识别、句法分析等处理方法从文档中抽取出相关的句子或短语作为问题的答案返回给用户。 本文还对实现的中文自动问答系统进行了测试,对测试结果进行了分析。最后对论文工作进行了总结,指出了本文中实现的问答系统还需要改进的地方,为中文自动问答系统的进一步研究提供了参考。
引用
收藏
页数:67
共 5 条
[1]
基于层叠隐马尔可夫模型的中文命名实体识别 [J].
俞鸿魁 ;
张华平 ;
刘群 ;
吕学强 ;
施水才 .
通信学报, 2006, (02) :87-94
[2]
一个统计与规则相结合的中文命名实体识别系统 [J].
向晓雯 ;
史晓东 ;
曾华琳 .
计算机应用, 2005, (10) :2404-2406
[3]
基于网络的中文问答系统及信息抽取算法研究 [J].
崔桓 ;
蔡东风 ;
苗雪雷 .
中文信息学报, 2004, (03) :24-31
[4]
基于语义计算的语句相关度研究 [J].
李素建 .
计算机工程与应用 , 2002, (07) :75-76+83
[5]
面向语料库标注的汉语依存体系的探讨 [J].
周明 ;
黄昌宁 .
中文信息学报, 1994, (03)