基于语言规则的病症菌实体抽取

被引:9
作者
许华 [1 ,2 ]
刘茂福 [1 ,2 ]
姜丽 [1 ,2 ]
顾进广 [1 ,2 ]
机构
[1] 武汉科技大学计算机科学与技术学院
[2] 智能信息处理与实时工业系统湖北省重点实验室
关键词
实体抽取; 医疗领域; 语言规则;
D O I
10.14188/j.1671-8836.2015.02.008
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
实体抽取在自然语言处理领域中已经相当成熟;随着电子医疗文本急剧增加,医疗实体抽取在医疗领域的应用越来越受到关注.然而,针对医疗领域的专业术语,通用实体抽取方法普遍存在准确率不高的问题.针对药品说明书中的疾病、症状和致病菌,本文采用语言规则的方法,对其进行抽取并评价其准确性.首先,根据已有的术语表分词、词性标注并进行实体抽取;其次,根据语言规则识别医疗实体,从而提高实体抽取的准确率.实验结果显示各类医疗实体抽取的准确率可达80%以上.
引用
收藏
页码:151 / 155
页数:5
相关论文
共 6 条
[1]   基于多步聚类的汉语命名实体识别和歧义消解 [J].
李广一 ;
王厚峰 .
中文信息学报 , 2013, (05) :29-34+42
[2]   自然语言处理技术在网络案情分析系统中的应用 [J].
李静 ;
罗文华 ;
林鸿飞 .
计算机工程与应用 , 2012, (03) :216-220
[3]   电子病历中命名实体的智能识别 [J].
叶枫 ;
陈莺莺 ;
周根贵 ;
李昊旻 ;
李莹 .
中国生物医学工程学报, 2011, 30 (02) :256-262
[4]   A hybrid system for temporal information extraction from clinical text [J].
Tang, Buzhou ;
Wu, Yonghui ;
Jiang, Min ;
Chen, Yukun ;
Denny, Joshua C. ;
Xu, Hua .
JOURNAL OF THE AMERICAN MEDICAL INFORMATICS ASSOCIATION, 2013, 20 (05) :828-835
[5]  
中文信息抽取原理及应用.[M].程显毅; 朱倩; 王进; 编著.科学出版社.2010,
[6]  
医学微生物学.[M].贾文祥主编;.人民卫生出版社.2001,