生物医学文本中命名实体识别研究

被引:5
作者
张向喆
王明辉
赵洪波
王起山
潘玉春
机构
[1] 上海交通大学农业与生物学院
基金
国家高技术研究发展计划(863计划);
关键词
生物信息学; 生物命名实体识别; 生物医学文献;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
生物命名实体识别是对生物医学文本进行信息处理的关键技术。准确的生物命名实体识别工具是对文本进行后续工作如信息提取或文本分类等的先决条件。经过多年的研究,生命科学领域生物命名实体识别取得了一定的进展。本文总结了生物命名实体的特征,分析了基于不同方法的生物命名实体识别系统,及生物命名实体识别方法在提取蛋白质互作等方面的丰富应用,并展望了未来的发展趋势。
引用
收藏
页码:132 / 139
页数:8
相关论文
共 16 条
[1]   信息抽取研究综述 [J].
李保利 ;
陈玉忠 ;
俞士汶 .
计算机工程与应用, 2003, (10) :1-5+66
[2]  
基于蛋白质序列和生物医学文献的蛋白质功能挖掘[D]. 俞晓晶.中国科学院研究生院(上海生命科学研究院). 2006
[3]  
统计自然语言处理基础[M]. - 电子工业出版社 , (美)ChristopherD.Manning, 2005
[4]   Exploiting the contextual cues for bio-entity name recognition in biomedical literature [J].
Yang, Zhihao ;
Lin, Hongfei ;
Li, Yanpeng .
JOURNAL OF BIOMEDICAL INFORMATICS, 2008, 41 (04) :580-587
[5]   Getting started in text mining [J].
Cohen, K. Bretonnel ;
Hunter, Lawrence .
PLOS COMPUTATIONAL BIOLOGY, 2008, 4 (01)
[6]   Rich features based Conditional Random Fields for biological named entities recognition [J].
Sun, Chengjie ;
Guan, Yi ;
Wang, Xiaolong ;
Lin, Lei .
COMPUTERS IN BIOLOGY AND MEDICINE, 2007, 37 (09) :1327-1333
[7]   Enhancing performance of protein and gene name recognizers with filtering and integration strategies [J].
Hou, WJ ;
Chen, HH .
JOURNAL OF BIOMEDICAL INFORMATICS, 2004, 37 (06) :448-460
[8]   Term identification in the biomedical literature [J].
Krauthammer, M ;
Nenadic, G .
JOURNAL OF BIOMEDICAL INFORMATICS, 2004, 37 (06) :512-526
[9]   Biomedical named entity recognition using two-phase model based on SVMs [J].
Lee, KJ ;
Hwang, YS ;
Kim, S ;
Rim, HC .
JOURNAL OF BIOMEDICAL INFORMATICS, 2004, 37 (06) :436-447
[10]   Improving the performance of dictionary-based approaches in protein name recognition [J].
Tsuruoka, Y ;
Tsujii, J .
JOURNAL OF BIOMEDICAL INFORMATICS, 2004, 37 (06) :461-470