CRF与词典相结合的疾病命名实体识别

被引:10
作者
龙光宇 [1 ,2 ]
徐云 [1 ,2 ,3 ]
机构
[1] 中国科学技术大学计算机科学与技术学院
[2] 中国科学技术大学安徽省高性能计算重点实验室
[3] 国防科学技术大学高性能计算协同创新中心
关键词
疾病命名实体识别; 医学术语词典; 条件随机场;
D O I
10.19358/j.issn.1674-7720.2017.21.016
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
生物医学文献中的疾病命名实体识别问题是疾病相关的生物信息学分析基础,疾病命名实体中的医学术语识别和边界确定是该问题的难点和关键。文中提出了一种CRF(Conditional Random Field)与词典相结合的疾病命名实体识别方法。该方法利用网络资源来构建含有语义信息的医学术语词典,并使用该词典对医学术语进行识别,获得医学术语的语义信息,然后CRF结合这些信息对疾病命名实体进行识别。实验结果表明该方法有效。
引用
收藏
页码:51 / 53
页数:3
相关论文
共 3 条
[1]  
生物医学文本中的疾病实体识别和标准化研究.[D].杨娅.大连理工大学.2015, 03
[2]  
NCBI disease corpus: A resource for disease name recognition and concept normalization.[J].Rezarta Islamaj Doğan;Robert Leaman;Zhiyong Lu.Journal of Biomedical Informatics.2014,
[3]   DNorm: disease name normalization with pairwise learning to rank [J].
Leaman, Robert ;
Dogan, Rezarta Islamaj ;
Lu, Zhiyong .
BIOINFORMATICS, 2013, 29 (22) :2909-2917