针对复杂问题优化的知识图谱问答系统的研究和实现

被引:0
作者
童培豪
机构
[1] 华东师范大学
关键词
问答系统; 复杂问题; 主题实体识别; 关系发现; 约束检测;
D O I
暂无
年度学位
2019
学位类型
硕士
导师
摘要
近年来,随着人工智能技术的异军突起,智能问答系统也随之飞速发展,智能问答逐渐成为了传统信息访问方式的一种重要补充。在智能问答领域里,以基于知识图谱的问答系统(KG-QA)为代表,在近几年吸引了大量研究者对其进行研究。知识图谱作为人工智能时代最重要的知识表示方式之一,它的出现使得我们可以使用更加直观的方式来描述真实世界中的各类实体、概念。在问答系统中,知识图谱则是被当作答案库,系统通过分析自然语言形式的问题,在知识图谱中找寻与给定问题相匹配的实体,最终将该实体作为答案返回。如今,基于知识图谱的问答系统被广泛应用于各个领域,为人们和结构化数据进行交互提供了更便捷的访问方式。然而,随着越来越多决策使用场景的出现,用户访问信息需求,即用户输入问题变得更加复杂。目前,大多数KG-QA系统都无法准确处理问题中隐含的复杂关系和特征,这也给问答系统带来了新的挑战。为了针对性地解决这些复杂问题的问答,本文构建了一套优化的高性能知识库问答系统。复杂问题的复杂性体现在问题所隐含关系的跳数较长,生成候选关系的数量就会随之大量增多,这为后续的关系发现任务带来了极大的困难。因此解决复杂问题问答的关键在于复杂问题关系的发现。为了更加专注于解决复杂问题的关系发现任务,本文将该系统分为主题实体识别、关系发现、系统整合三个子模块,并针对三个子模块在现有研究的基础上分别提出了优化方案。对于主题实体识别模块,本文在传统方法仅使用序列标注模型对问题进行主题词标注的基础上进行优化,在模型中增加了启发式匹配和重排序的环节,引入了更多知识图谱有效信息,从而提高了主题实体识别的准确率。对于关系发现模块,不同于以往模型只专注于问题和关系的局部信息,本文设计了一套基于局部-全局信息的关系发现模型,这个模型能够充分利用知识图谱中的各类信息,并结合局部-全局双向注意力机制,以解决复杂的关系发现任务。最后在系统整合模块,本文将主题实体识别模块和关系发现模块整合为最终的问答系统,同时针对约束型问题,本文又引入一套基于文本匹配的约束检测策略,从而提高了系统对约束型问题的回答准确率。最后,本文对主题实体识别、关系发现以及最终的整合系统分别设计了相应的实验。实验结果表明本文所提出的模型能够在问答任务中取得良好的结果,这也验证了本文所提出模型的优越性和有效性。
引用
收藏
页数:85
共 10 条
[1]
知识表示学习研究进展 [J].
刘知远 ;
孙茂松 ;
林衍凯 ;
谢若冰 .
计算机研究与发展, 2016, 53 (02) :247-261
[2]
机器学习.[M].周志华.清华大学出版社.2016,
[3]
Type-Aware Question Answering over Knowledge Base with Attention-Based Tree-Structured Neural Networks [J].
Yin, Jun ;
Zhao, Wayne Xin ;
Li, Xiao-Ming .
JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, 2017, 32 (04) :805-813
[4]
Learning Dependency-Based Compositional Semantics [J].
Liang, Percy ;
Jordan, Michael I. ;
Klein, Dan .
COMPUTATIONAL LINGUISTICS, 2013, 39 (02) :389-446
[5]
Semantics and Complexity of SPARQL [J].
Perez, Jorge ;
Arenas, Marcelo ;
Gutierrez, Claudio .
ACM TRANSACTIONS ON DATABASE SYSTEMS, 2009, 34 (03)
[6]
A survey of named entity recognition and classification [J].
Nadeau, David ;
Sekine, Satoshi .
LINGUISTICAE INVESTIGATIONES, 2007, 30 (01) :3-26
[7]
Framewise phoneme classification with bidirectional LSTM and other neural network architectures.[J].Alex Graves;Jürgen Schmidhuber.Neural Networks.2005, 5
[8]
Predicting transmembrane protein topology with a hidden markov model: application to complete genomes 1 1 Edited by F. Cohen.[J]..Journal of Molecular Biology.2001, 3
[9]
Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780
[10]
LTP:语言技术平台.[A].郎君;刘挺;张会鹏;李生;.第三届学生计算语言学研讨会.2006,