基于多特征融合的中文电子病历命名实体识别

被引:14
作者
张祥伟
李智
机构
[1] 四川大学电子信息学院
关键词
中文电子病历; 命名实体识别; 多特征融合; 条件随机场;
D O I
暂无
中图分类号
R197.323 [业务管理]; TP391.1 [文字信息处理];
学科分类号
1004 ; 120402 ; 081203 ; 0835 ;
摘要
中文电子病历命名实体识别对于医学知识库的构建和临床决策作用关键。针对中文电子病历结构化实体识别困难的问题,提出一种多特征融合的中文电子病历命名实体识别方法。该方法基于条件随机场,通过逐一融合语言符号、词性、关键词、词典、词聚类等多种特征,采用递增式学习策略验证其有效性,在最优特征组合下识别出疾病、症状、检查和治疗4类实体。实验结果表明,该方法识别准确率达到90.99%,有效满足了应用需求。
引用
收藏
页码:128 / 131
页数:4
相关论文
共 3 条
[1]   电子病历命名实体识别和实体关系抽取研究综述 [J].
杨锦锋 ;
于秋滨 ;
关毅 ;
蒋志鹏 .
自动化学报, 2014, 40 (08) :1537-1562
[2]   基于条件随机场的中医命名实体识别 [J].
王世昆 ;
李绍滋 ;
陈彤生 .
厦门大学学报(自然科学版), 2009, 48 (03) :359-364
[3]   What can natural language processing do for clinical decision support? [J].
Demner-Fushman, Dina ;
Chapman, Wendy W. ;
McDonald, Clement J. .
JOURNAL OF BIOMEDICAL INFORMATICS, 2009, 42 (05) :760-772