生物医学命名实体识别的研究与进展

被引:24
作者
郑强 [1 ,2 ]
刘齐军 [1 ,2 ]
王正华 [1 ]
朱云平 [2 ]
机构
[1] 国防科学技术大学并行与分布处理国家重点实验室
[2] 军事医学科学院放射与辐射医学研究所北京蛋白质组研究中心蛋白质组学国家重点实验室
关键词
命名实体识别; 文本挖掘; 特征选择; 机器学习;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
为直接高效地获取文献中的知识,命名实体识别用来识别文本中具有特定意义的实体。这是应用文本挖掘技术自动获取知识的关键的第一步,因此受到日益广泛的关注。主要从评测方法、特征选择、机器学习方法和后期处理等方面介绍了近年来生物医学命名实体识别方面的主要研究方法及成果,并对目前各方面存在的问题进行了分析和讨论,最后对该领域的研究前景进行了展望。
引用
收藏
页码:811 / 815+832 +832
页数:6
相关论文
共 4 条
[1]   Biomedical named entity recognition using two-phase model based on SVMs [J].
Lee, KJ ;
Hwang, YS ;
Kim, S ;
Rim, HC .
JOURNAL OF BIOMEDICAL INFORMATICS, 2004, 37 (06) :436-447
[2]   SUPPORT-VECTOR NETWORKS [J].
CORTES, C ;
VAPNIK, V .
MACHINE LEARNING, 1995, 20 (03) :273-297
[3]  
Efficiently inducing features of conditional random fields .2 McCallum A. Proc.of the 19~ (th) Conference on Uncertainty in Artificial Intelligence 2003 .
[4]  
Exploring the boundaries:gene and protein identification in biomedical text .2 Finkel J,Dingare S,Manning CD,Nissim M,Alex B,Grover C. BMC Bioinformatics . 2005