基于中文知识库的问答系统研究与实现

被引：0

作者：

史梦飞

机构：

[1] 华东师范大学

关键词：

知识库; 问答系统; 问句分类; 深度学习; 注意力机制;

D O I：

暂无

年度学位：

2018

学位类型：

硕士

导师：

贺樑;

摘要：

随着大数据时代的来临,面对互联网上纷繁复杂的数据,传统的基于关键词匹配的检索模式已经越来越不能满足用户的需求,如何精准高效的获取有效信息成为一个重要的社会议题。由于基于知识库的问答系统能够根据用户提出的问题直接返回一个确定的答案,而不像传统搜索引擎那样返回一系列的排序文档,所以依靠其精准化推送答案和推理计算的特点,成为当下一个非常热门的研究课题。在基于知识库的问答系统研究中,主要有两大类研究方向:一种是基于深度学习的知识库问答,另一种是基于符号表示的知识库问答。基于深度学习的知识库问答将整个问答过程看成是一个问句与知识库的语义匹配过程,在基于此方法的端到端(End2End)问答模型研究中,大多数方法更侧重于语义空间的相似度计算,对于问句本身的意图理解考虑较少,而用户询问意图识别的准确率会极大地影响到知识库问答系统的性能。基于符号表示的知识库问答所采用的主流方法是通过对问句进行语义分析再转化为结构化的查询语句。同时,相比较英文,中文的语言特性更为复杂,表述更为多样,而且很多实际应用的中文知识库系统仍然以模板式的问答方法为主,召回率较低。针对目前的一些研究情况,本文的主要研究内容如下:1.为了更好地理解用户提问意图,充分捕捉问句重要信息,提出了一种基于卷积神经网络和双向长短时记忆网络并带有注意力机制的问句分类算法。2.本文提出了一种融合用户意图类别信息的深度神经网络End2End问答模型,该方法使用双向长短时记忆网络对问句进行表示,结合了注意力机制来捕获问句关键信息,并利用问句的意图分类信息来筛选答案。3.针对中文语句复杂且多样化的特点,本文提出了一种结合基于语义依存分析的剪枝算法及自动化模板的问答方法,通过将问句映射成自定义的新型逻辑形式并生成标准查询语句进行答案查询,并在此基础上设计开发了一套基于特定领域的中文知识库问答系统。本文在多个公开数据集和自行构建的数据集上进行问句分类和问答实验,在多项测评指标上都取得了不错的实验结果,多组实验结果对比也证明了本文提出方法的有效性。

引用

页数：73

共 11 条

[1]

基于信息抽取的实体知识库系统研究 [D].