基于甲状腺知识图谱的自动问答系统设计与实现

被引:0
作者
马晨浩
机构
[1] 东华大学
关键词
甲状腺疾病; 知识图谱; 自动问答系统; SPARQL查询;
D O I
暂无
年度学位
2018
学位类型
硕士
摘要
随着人们生活水平的提高,甲状腺疾病的发生已经并不罕见,而国内甲状腺医疗资源分布不均,造成了大型医院人满为患、医生接诊病人多、病人看病时间长等问题。随着“互联网+”技术以及智慧医疗的迅速发展,甲状腺患者会寻求在线医疗咨询平台如寻医问药网、好大夫在线网等进行甲状腺疾病咨询。但这类平台需要医生在线,通过人工答诊的方式为患者提供咨询服务,导致这类在线咨询平台缺乏自动智能化问诊与答诊的途径,无法为大量的患者提供及时的疾病咨询服务。如何为甲状腺患者提供自动化的在线问答服务,已成为智慧医疗领域广泛关注的课题。甲状腺患者在就诊过程中会产生大量的甲状腺电子病历数据,这些数据为甲状腺诊疗自动问答系统的实现提供了数据来源。为此,本文在上海某三甲医院甲状腺电子病历的基础上,构建了甲状腺知识图谱,并基于甲状腺知识图谱,利用自然语言处理结合知识图谱查询技术,设计并实现一个面向甲状腺诊疗的自动问答系统。本文的研究内容主要包括:1)设计了基于甲状腺知识图谱的自动问答系统总体架构:阐述了系统的总体架构,将整个系统分为甲状腺知识图谱构建子系统和甲状腺诊疗自动问答子系统。甲状腺知识图谱构建子系统负责构建甲状腺诊疗自动问答系统进行查询的知识库,甲状腺诊疗自动问答子系统负责对用户输入的自然语言问句转化为知识图谱查询语句,而后得到问句的答案。根据子系统的各功能以及相互关系设计了整个系统的架构图,并对两个子系统分别进行了概述。2)设计了甲状腺知识图谱构建子系统:首先对甲状腺电子病历数据特点进行了分析,从中提取甲状腺相关术语,通过归纳同类术语,获得甲状腺知识图谱的相关概念,据此设计了甲状腺知识图谱概念模式结构。然后,分析概念模式结构,定义了概念之间的关系,完成甲状腺知识图谱概念模式的设计。随后,从数据库中提取甲状腺相关数据作为实体集,根据设计的概念模式进行实体填充操作。最后将实体以及实体关系以三元组<实体-关系-属性>构成甲状腺知识图谱。3)设计了基于甲状腺知识图谱的自动问答处理流程:甲状腺诊疗自动问答子系统主要由问句预处理模块和答案生成模块组成。在问句预处理模块中,首先利用中文分词算法将用户输入的问句进行分词操作,通过关键词获得问句的类别。其次,针对甲状腺咨询问句语料采用LSTM+CRF算法生成识别模型,利用该模型从问句中获得甲状腺实体。而后,利用LTP-parser工具对问句进行依存句法分析,得到句子中各结构的主客关系,形成问句的三元组形式。最后,将问句三元组中的实体映射到知识图谱的实体上,避免对不存在于知识图谱中的实体进行查询,获得查询的三元组。在答案生成模块中,根据问句类别,将问句预处理模块得到的查询三元组与SPARQL查询模板进行匹配,把自然语言的问题转化为知识图谱查询语言,通过在知识图谱内进行查询,得到问句的答案,再对问句的答案进行针对性的处理,最终反馈给用户。4)实现了基于甲状腺知识图谱的自动问答系统方案:首先对甲状腺知识图谱的构建细节以及构建成果进行展示。其次对自动问答系统中问句预处理模块和答案生成模块的实现过程以及系统成果进行展示。测试结果证明本文的自动问答系统具有较好的可用性。
引用
收藏
页数:55
共 30 条
[1]
文物知识图谱构建与检索关键技术研究与实现 [D]. 
林炀平 .
浙江大学,
2017
[2]
基于递归神经网络的生物医学命名实体识别 [D]. 
金留可 .
大连理工大学,
2016
[3]
“互联网+”模式下我国医疗服务体系建设研究 [D]. 
高玮 .
天津大学,
2016
[4]
基于循环神经网络的依存句法分析模型研究 [D]. 
张俊驰 .
湖北大学,
2016
[5]
基于中文知识图谱的电商领域问答算法设计与系统实现 [D]. 
杜泽宇 .
华东师范大学,
2016
[6]
基于汉语虚词用法的语义角色标注研究 [D]. 
刘一韬 .
郑州大学,
2015
[7]
基于产品评论的观点挖掘研究 [D]. 
张阳 .
西北大学,
2014
[8]
互联网搜索引擎企业品牌建设研究 [D]. 
岳婉星 .
首都经济贸易大学,
2014
[9]
基于文本分类的SNS社区发布订阅技术研究 [D]. 
兰瑞 .
华中科技大学,
2012
[10]
基于本体的自动问答系统 [D]. 
周永梅 .
江苏科技大学,
2011