中文历史人物亲属关系自动问答研究

被引:0
作者
肖大军
机构
[1] 华中师范大学
关键词
亲属关系; 知识图谱; 翻译模型; 关系推理; 问答系统;
D O I
暂无
年度学位
2018
学位类型
硕士
导师
摘要
在人们对快速、准确获取信息的需求下,搜索引擎和检索方式不断地更新迭代。一方面,伴随着数字化产业的蓬勃发展,产生出了越来越多有待开发的数字资源。另一方面,伴随着自动问答技术的发展,用户已不再满足于关键字匹配的查询,开始寻求更简洁、准确的检索引擎。中国历代人物传记资料库就是数字化产业的冰山一角,如何将数字化的产物倾注智能问答的灵魂,使得合成的产品更好地为用户服务,本文进行了初步的研究与探索。本文研究了推理补全缺失关系的方法,设计并实现了一个基于知识图谱的人物亲属关系自动问答系统,解决了搜索引擎不支持自然语言检索,返回结果不简洁的问题。本文的主要工作如下:第一,研究了知识库表示学习中的翻译模型,通过现有多种翻译模型的对比实验,找出一种合适的知识库表示方法,实现了历史人物亲属关系自动推理,有效解决了中国历代人物传记资料库中人物亲属关系大量缺失的问题。之后对比分析了人物亲属关系推理补全前后的结果,以及产生推理错误可能的原因。第二,改进了翻译模型。翻译模型是将知识库中的实体和关系转化为低维向量的方法。本文在现有翻译模型的基础上,通过改进负采样的方式融合实体特征,使得实体和关系向量在空间上分布更加合理,更加具有表现力,通过实验证明此方法能有效提高关系推理的准确性,其可行性在中国历代人物传记资料数据中得到有效验证。第三,利用改进了的翻译模型方法,设计并实现了一个中文历史人物亲属关系自动问答系统。该系统以中国历代人物传记资料库(CBDB)为语料来源,将存储于access关系型数据库中的中文历史人物亲属关系,转化为通过Neo4j图数据库存储的人物亲属关系知识图谱,便于可视化展示与分析人物关系。针对用户提出的自然语言的问题,本系统利用自然语言处理相关技术生成问题三元组,然后转换为Cypher查询语句在图数据库中查询、或利用人物关系推理返回问题答案。
引用
收藏
页数:58
共 15 条
[1]
红楼梦人物关系问答系统.[A].王树西;刘群;白硕;.第一届学生计算语言学研讨会.2002,
[2]
基于知网的中文问题自动分类.[A].孙景广;蔡东风;吕德新;董燕举;.第三届学生计算语言学研讨会.2006,
[3]
财经问答系统问句解析子系统 [D]. 
史佳慧 .
哈尔滨工业大学,
2012
[4]
基于表示学习的知识库问答研究进展与展望 [J].
刘康 ;
张元哲 ;
纪国良 ;
来斯惟 ;
赵军 .
自动化学报, 2016, 42 (06) :807-818
[5]
一种基于大知识库的亲属关系自动推理模型 [J].
陈振宇 ;
袁毓林 ;
张秀松 ;
周强 .
中文信息学报, 2010, 24 (03) :117-123
[6]
汉语亲属关系的语义表示和自动推理 [J].
陈振宇 ;
袁毓林 .
中国语文, 2010, (01) :44-56+96
[7]
亲属关系的逻辑意义及其自动推理 [J].
陈振宇 ;
袁毓林 ;
张秀松 ;
周强 .
计算机工程与应用, 2009, 45 (16) :43-47
[8]
问答系统:核心技术、发展趋势 [J].
王树西 .
计算机工程与应用, 2005, (18) :1-3
[9]
问答式检索技术及评测研究综述 [J].
吴友政 ;
赵军 ;
段湘煜 ;
徐波 .
中文信息学报, 2005, (03) :1-13
[10]
一个人物关系问答的专家系统 [J].
王树西 ;
刘群 ;
白硕 .
广西师范大学学报(自然科学版), 2003, (01) :31-36