在线医疗文本中的实体识别研究

被引:25
作者
苏娅
刘杰
黄亚楼
机构
[1] 南开大学计算机与控制工程学院(软件学院)
基金
天津市自然科学基金;
关键词
实体识别; 数据挖掘; 条件随机场; 医疗信息;
D O I
10.13209/j.0479-8023.2016.020
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对在线医疗文本,设计考虑医疗领域特性的识别特征,并在自建数据集上进行实体识别实验。针对常见的5类疾病:胃炎、肺癌、哮喘、高血压和糖尿病,采用近年来较先进的机器学习模型条件随机场,进行训练和测试,抽取目标实体包括疾病、症状、药品、治疗方法和检查5类。通过采用逐一添加特征的实验方式,验证所提特征的有效性,取得总体上81.26%的准确率和60.18%的召回率,随后对识别特征给出进一步分析。
引用
收藏
页码:1 / 9
页数:9
相关论文
共 9 条
[1]   电子病历命名实体识别和实体关系抽取研究综述 [J].
杨锦锋 ;
于秋滨 ;
关毅 ;
蒋志鹏 .
自动化学报, 2014, 40 (08) :1537-1562
[2]   文本挖掘技术在药物研究中的应用 [J].
胡双 ;
陆涛 ;
胡建华 .
医学信息学杂志, 2013, 34 (08) :49-53
[3]   电子病历中命名实体的智能识别 [J].
叶枫 ;
陈莺莺 ;
周根贵 ;
李昊旻 ;
李莹 .
中国生物医学工程学报, 2011, 30 (02) :256-262
[4]   生物医学命名实体识别的研究与进展 [J].
郑强 ;
刘齐军 ;
王正华 ;
朱云平 .
计算机应用研究, 2010, 27 (03) :811-815+832
[5]   基于条件随机场的中医命名实体识别 [J].
王世昆 ;
李绍滋 ;
陈彤生 .
厦门大学学报(自然科学版), 2009, 48 (03) :359-364
[6]   网络医疗对医疗服务理念的挑战 [J].
黄丹 .
中药研究与信息, 2005, (09) :31-32
[7]  
International Classification of Diseases 10th Revision (ICD-10)[J] . Jan DiSantostefano.The Journal for Nurse Practitioners . 2009 (1)
[8]  
The Regenstrief Medical Record System: a quarter century experience[J] . Clement J. McDonald,J.Marc Overhage,William M. Tierney,Paul R. Dexter,Douglas K. Martin,Jeffrey G. Suico,Atif Zafar,Gunther Schadow,Lonnie Blevins,Tull Glazener,Jim Meeks-Johnson,Larry Lemmon,Jill Warvel,Brian Porterfield,Jeff Warvel,Pat Cassidy,Don Lindbergh,Anne Belsito,Mark Tucker,Bruce Williams,Cheryl Wodniak.International Journal of Medical Informatics . 1999 (3)
[9]  
Ansjseg .2 孙建. https://github.com/NLPchina/ansjseg . 2012