问答系统能够以自然语言的方式进行提问,并能以自然语言的形式进行回答,是一种新型的智能搜索引擎。与传统的搜索引擎相比,问答系统能更好的满足用户的查询要求,更准确地检索出用户所需要的答案。
问答系统的研究受到国内外很多科研机构的重视,并且已开发出相对成熟的英文问答系统,而中文问答系统的研究还有所欠缺。本文在此基础上,利用概念图的理论对中文问答系统的相关技术进行研究,并实现了一个基于概念图的中文问答系统。本系统主要包括问题理解、信息检索、答案抽取三个模块,具体的研究内容如下:
(1)在问题理解模块中,对传统的问题分类的方法进行改进,采用疑问词短语及问句标准型相结合的方式对问题进行分类,并利用问题中的特征词对问题进行领域分类;利用本体资源对概念图的生成作了研究,并采用概念图的形式对问句进行语义层次的分析;利用本体知识库,对关键词从同义关系及相关关系两方面进行扩展。
(2)在信息检索模块,首先进行FAQ库的检索,如果在FAQ库中找不到答案,转向网络检索,并利用答案抽取模块进行答案抽取;采用三种知识来源对FAQ库进行构建及更新,并在FAQ库中引入反向索引机制,对FAQ库中的问题进行领域分类;改进了概念图的语义相似度的算法,并利用此算法对用户问句及FAQ库中的问句进行相似度的计算,利用句子相似度的计算实现基于FAQ库的检索。
(3)在答案抽取模块,利用命名实体识别技术与句子相似度计算相结合的方法进行答案抽取。
最后针对以上提出的方法,对本系统进行测试与分析,实验结果验证本文所采用方法的可行性。