基于层叠条件随机场的中文病历命名实体识别

被引:19
作者
燕杨 [1 ,2 ]
文敦伟 [3 ]
王云吉 [1 ]
王珂 [1 ]
机构
[1] 吉林大学通信工程学院
[2] 长春师范大学计算机科学与技术学院
[3] 阿萨巴斯卡大学计算与信息系统学院
关键词
信息处理技术; 条件随机场; 层叠条件随机场; 中文病历; 命名实体识别;
D O I
10.13229/j.cnki.jdxbgxb201406047
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
提出了一种基于层叠条件随机场的中文病历命名实体识别新方法,该方法在第一层条件随机场模型中实现对病历中身体基本部位或组织和基本疾病名称的识别,将识别结果传递到第二层条件随机场模型(Conditional Random Field,CRF),同时定义一个由词性和实体特征结合而成的组合特征,与字符特征、词边界特征及上下文特征共同作为第二层CRF模型的特征集,为疾病名称和临床症状两类命名实体的识别提供决策支持。在利用CRF++进行的开放测试中,本文模型相比于无自定义组合特征的层叠CRF模型,F值提高了3%;相比于单层CRF模型,F值提高了7%,总体性能有显著提高。
引用
收藏
页码:1843 / 1848
页数:6
相关论文
共 4 条
[1]  
基于本体的医学命名实体识别技术研究.[D].夏涵.上海交通大学.2012, 07
[2]   生物医学命名实体识别的研究与进展 [J].
郑强 ;
刘齐军 ;
王正华 ;
朱云平 .
计算机应用研究, 2010, 27 (03) :811-815+832
[3]   命名实体识别、排歧和跨语言关联 [J].
赵军 .
中文信息学报, 2009, (02) :3-17
[4]   基于层叠条件随机场模型的中文机构名自动识别 [J].
周俊生 ;
戴新宇 ;
尹存燕 ;
陈家骏 .
电子学报, 2006, (05) :804-809