基于E-CNN和BLSTM-CRF的临床文本命名实体识别

被引:15
作者
曹春萍
关鹏举
机构
[1] 上海理工大学光电信息与计算机工程学院
基金
上海市自然科学基金;
关键词
命名实体识别; 临床文本; 集成的卷积神经网络;
D O I
10.19734/j.issn.1001-3695.2018.09.0606
中图分类号
R-05 [医学与其他学科的关系]; TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
1001 ; 081203 ; 0835 ; 081104 ; 0812 ; 1405 ;
摘要
在生物医学临床病历文本的命名实体识别任务中,传统的解决方案由于对实体的边界划分不够精确,影响了部分复合实体的识别。通过研究复合实体的特性,提出一种集成的卷积神经网络(E-CNN)模型与双向长短期记忆网络(BLSTM)和条件随机场(CRF)结合的模型,通过对CNN中的卷积层设定不同卷积窗口的大小,来捕获多个词语之间更丰富的边界特征信息。然后将集成的特征信息传递给BLSTM模型进行训练,最后由CRF模型得到最终的序列标注。实验结果表明,该方法针对临床病历文本中的复合实体识别具有良好的效果。
引用
收藏
页码:3748 / 3751
页数:4
相关论文
共 22 条
[1]   基于词表示方法的生物医学命名实体识别 [J].
李丽双 ;
何红磊 ;
刘珊珊 ;
黄德根 .
小型微型计算机系统, 2016, 37 (02) :302-307
[2]  
Applying active learning to assertion classification of concepts in clinical text[J] . Yukun Chen,Subramani Mani,Hua Xu. &nbspJournal of Biomedical Informatics . 2011 (2)
[3]  
Electronic Medical Records (EMRs), Epidemiology, and Epistemology: Reflections on EMRs and Future Pediatric Clinical Research[J] . Richard C. Wasserman. &nbspAcademic Pediatrics . 2011 (4)
[4]  
Named entity recognition in Chinese electronic medical records based on CRF. Liu Kaixin,Hu Qingcheng,Liu Jianwei et al. Proc of the 14th Web Information Systems and Applications Conference . 2017
[5]   基于CNN-BLSTM-CRF模型的生物医学命名实体识别 [J].
李丽双 ;
郭元凯 .
中文信息学报, 2018, 32 (01) :116-122
[6]   基于多特征融合的中文电子病历命名实体识别 [J].
张祥伟 ;
李智 .
软件导刊, 2017, 16 (02) :128-131
[7]   CRF与规则相结合的医学病历实体识别 [J].
栗伟 ;
赵大哲 ;
李博 ;
彭新茗 ;
刘积仁 .
计算机应用研究, 2015, 32 (04) :1082-1086
[8]  
Dynamic Conditional RandomFields: Factorized Probabilistic Models for Labeling and Segmenting SequenceData. C. Sutton,K. Rohanimanesh,A. McCallum. International Conference on Machine Learning . 2004
[9]   在线医疗文本中的实体识别研究 [J].
苏娅 ;
刘杰 ;
黄亚楼 .
北京大学学报(自然科学版), 2016, 52 (01) :1-9
[10]  
Extracting clinical relationships from patient narratives. Roberts A,Gaizauskas R,Hepple M. Proceedings of the2008 Workshop on Current Trends in Biomedical Natural Language Processing . 2008