面向中文文本的医学知识获取、表示与推理

被引:0
作者
赵超
机构
[1] 哈尔滨工业大学
关键词
中文电子病历; 医学知识网络; 马尔科夫网; 信息抽取; 医学知识图谱;
D O I
暂无
年度学位
2018
学位类型
硕士
导师
摘要
面向文本的知识获取、表示与推理属于自然语言处理、知识表示和知识推理的交叉课题,主要研究利用自动化方法从文本中抽取三元组信息、将信息加工成为知识图谱、并利用已有知识发现新知识等问题。这些问题用于模拟智能系统从外部获取信息、生成知识结构、以及利用知识进行推理的能力,是智能体不可缺少的能力,是整个人工智能的核心。经过二十余年的发展,面向文本的知识获取、表示与推理系统在开放域中获取了一定的成功,出现了bootstrapping、远程监督(distant supervision)等一些经典的知识抽取方法;YAGO、NELL等一些大型知识库;以及Path-Ranking、Trans X等一些知识推理方法。近年来,基于深度学习的方法为知识获取和推理注入了新的活力,被证明在多数情况下可以有效提高这些算法的性能。在限定域中,开放域的通用方法与领域特点相结合,往往可以在扩展知识深度的同时,避免开放域的一些难以解决的问题,如实体消歧等。限定域知识在医疗、法律、生物等专业领域、娱乐、饮食、商务等生活领域都发挥着重要的作用。本文关注于医疗领域,研究面向中文电子病历和半结构化医学文本的医学知识获取、表示与推理的关键技术。主要包含以下三个方面:(1)面向中文电子病历的医学知识获取与表示。针对医学实体关系自动抽取精度不高的问题,本文提出医学知识网络(medical knowledge network,MKN)作为电子病历医学知识表示方法。MKN是一个仅包含医学实体,不包含医学实体关系的网络。该网络以医学实体为节点,以实体在一份电子病历中的共现关系为边。虽然以共现为关系的三元组往往不能被视为医学知识,但相比于随机网络,MKN确实显示出了一定的知识复杂性,可以在其之上构建相应的知识推理系统。(2)面向半结构化医学文本的医学知识获取与表示。电子病历作为一种单一知识源,无法覆盖临床所需的全部的医疗知识。为了从其他来源进行知识挖掘,本文提出了一套医学知识图谱构建方案,包括实体识别、实体关系抽取等知识获取模块,以及知识描述、存储、归一、校验等知识加工模块。该方案可以从半结构化医学文本中抽取三元组信息,并自动整合为一个医学知识图谱。(3)基于马尔科夫随机场的临床决策推理。面向MKN以共现关系加以组织的特点,本文提出基于马尔科夫随机场的医学知识推理框架,针对疾病诊断、检查推荐、治疗方案推荐三大临床决策问题,结合图特征、边特征、分布式表示的节点特征等构建了6种势函数,设计3种评价指标对推理系统性能进行评估。真实电子病历上的实验表明该方法可以有效从MKN中过滤出医学知识。医学知识图谱可以为MKN推理提供节点归一和解释性功能。综上所述,本文面向两大类医学文本知识源,研究了在此之上的医学知识获取、表示与推理的关键技术。在真实的电子病历和医学文本数据上测试有效,取得了初步的研究成果。我们希望这些成果能够进一步应用到更广泛的医学文本数据和医学知识推理任务上,以进一步推动自然语言处理和知识表示与推理在医学领域的研究和发展。
引用
收藏
页数:85
共 43 条
[1]
电子病历命名实体识别和实体关系抽取研究综述 [J].
杨锦锋 ;
于秋滨 ;
关毅 ;
蒋志鹏 .
自动化学报, 2014, 40 (08) :1537-1562
[2]
DBpedia-Based Entity Linking via Greedy Search and Adjusted Monte Carlo RandomWalk [J].
Liu, Ming ;
Chen, Lei ;
Liu, Bingquan ;
Zheng, Guidong ;
Zhang, Xiaoming .
ACM TRANSACTIONS ON INFORMATION SYSTEMS, 2017, 36 (02)
[3]
Semantic Health Knowledge Graph: Semantic Integration of Heterogeneous Medical Knowledge and Services.[J].Longxiang Shi;Shijian Li;Xiaoran Yang;Jiaheng Qi;Gang Pan;Binbin Zhou;Uwe Kreimeier.BioMed Research International.2017,
[4]
De-identification of psychiatric intake records: Overview of 2016 CEGS N-GRID shared tasks Track 1.[J].Amber Stubbs;Michele Filannino;Özlem Uzuner.Journal of Biomedical Informatics.2017, S
[5]
Building a comprehensive syntactic and semantic corpus of Chinese clinical texts.[J].Bin He;Bin Dong;Yi Guan;Jinfeng Yang;Zhipeng Jiang;Qiubin Yu;Jianyi Cheng;Chunyan Qu.Journal of Biomedical Informatics.2017,
[6]
Deep learning for healthcare: review; opportunities and challenges..[J].Miotto Riccardo;Wang Fei;Wang Shuang;Jiang Xiaoqian;Dudley Joel T.Briefings in bioinformatics.2017, 6
[7]
Disease Surveillance on Complex Social Networks [J].
Herrera, Jose L. ;
Srinivasan, Ravi ;
Brownstein, John S. ;
Galvani, Alison P. ;
Meyers, Lauren Ancel .
PLOS COMPUTATIONAL BIOLOGY, 2016, 12 (07)
[8]
Development of a web-based liver cancer prediction model for type II diabetes patients by using an artificial neural network.[J].Hsiao-Hsien Rau;Anis Fuad;Chien-Yeh Hsu;Li-Ming Wei;Yu-An Lin;Ming-Huei Hsu;Suleman Atique.Computer Methods and Programs in Biomedicine.2015,
[9]
Information extraction from multi-institutional radiology reports.[J].Saeed Hassanpour;Curtis P. Langlotz.Artificial Intelligence In Medicine.2016, Jan.
[10]
Structure space of Bayesian networks is dramatically reduced by subdividing it in sub-networks.[J].Heni Bouhamed;Afif Masmoudi;Thierry Lecroq;Ahmed Rebaï.Journal of Computational and Applied Mathematics.2015,