基于领域词典与CRF双层标注的中文电子病历实体识别

被引:40
作者
龚乐君 [1 ,2 ]
张知菲 [1 ,2 ]
机构
[1] 南京邮电大学计算机学院软件学院网络空间安全学院
[2] 江苏省大数据安全与智能处理重点实验室
关键词
中文电子病历; 医疗实体识别; 领域词典; 条件随机场; 注意力机制;
D O I
10.13374/j.issn2095-9389.2019.09.04.004
中图分类号
R197.323 [业务管理]; TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
120407 [卫生政策与管理]; 120506 [数字人文]; 140502 [人工智能];
摘要
医疗实体识别是电子病历文本信息抽取的基本任务.针对中文电子病历文本复合实体较多、实体长度较长、句子成分缺失严重、实体边界不清的语言特点以及标注语料难以获取的现状,提出了一种基于领域词典和条件随机场(CRF)的双层标注模型.该模型通过对外部资源的统计分析构建医疗领域词典,再结合条件随机场,进行了两次不同粒度的标注,将领域词典识别的准确性和机器学习的自动性融为一体,从中文电子病历文本中识别出疾病、症状、药品、操作四类医疗实体.该模型在测试数据中的宏精确率为96.7%、宏召回率为97.7%、宏F1值为97.2%.同时对比分析了采用注意力机制的深度神经网络的识别效果,因受到领域数据集大小的限制,在该测试数据集中后者表现不佳.实验结果表明了该双层标注模型对中文医疗实体识别的高效性.
引用
收藏
页码:469 / 475
页数:7
相关论文
共 15 条
[1]
基于神经网络的中文电子病历命名实体识别.[D].申站.北京邮电大学.2018, 10
[2]
基于半监督学习的中文电子病历分词和名实体挖掘 [D]. 
张立邦 .
哈尔滨工业大学,
2014
[3]
Clinical Named Entity Recognition From Chinese Electronic Health Records via Machine Learning Methods [J].
Zhang, Yu ;
Wang, Xuwen ;
Hou, Zhen ;
Li, Jiao .
JMIR MEDICAL INFORMATICS, 2018, 6 (04) :242-254
[4]
Recognizing irregular entities in biomedical text via deep neural networks.[J].Fei Li;Meishan Zhang;Bo Tian;Bo Chen;Guohong Fu;Donghong Ji.Pattern Recognition Letters.2018,
[5]
Clinical information extraction applications: A literature review.[J].Yanshan Wang;Liwei Wang;Majid Rastegar-Mojarad;Sungrim Moon;Feichen Shen;Naveed Afzal;Sijia Liu;Yuqun Zeng;Saeed Mehrabi;Sunghwan Sohn;Hongfang Liu.Journal of Biomedical Informatics.2018,
[6]
Entity recognition from clinical texts via recurrent neural network.[J].Zengjian Liu;Ming Yang;Xiaolong Wang;Qingcai Chen;Buzhou Tang;Zhe Wang;Hua Xu.BMC Medical Informatics and Decision Making.2017, 2
[7]
Supervised methods for symptom name recognition in free-text clinical records of traditional Chinese medicine: An empirical study.[J].Yaqiang Wang;Zhonghua Yu;Li Chen;Yunhui Chen;Yiguang Liu;Xiaoguang Hu;Yongguang Jiang.Journal of Biomedical Informatics.2014,
[8]
统计学习方法.[M].李航; 著.清华大学出版社.2012,
[9]
基于深度学习的人体低氧状态识别 [J].
于露 ;
金龙哲 ;
王梦飞 ;
徐明伟 .
工程科学学报, 2019, 41 (06) :817-823
[10]
基于深度学习的电子病历命名实体识别附视频 [J].
夏宇彬 ;
郑建立 ;
赵逸凡 ;
徐霄玲 .
电子科技, 2018, (11) :31-34+37