面向生物医学命名实体识别的多Agent元学习框架

被引:21
作者
王浩畅 [1 ,2 ]
李钰 [2 ]
赵铁军 [3 ]
机构
[1] 东北石油大学计算机与信息技术学院
[2] 哈尔滨工业大学生命科学与工程系
[3] 哈尔滨工业大学计算机科学与技术学院
关键词
命名实体识别; 多Agent元学习框架; 元层Agent; 基层学习Agent; 局部特征选择;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
生物医学命名实体识别是生物医学数据挖掘的基本任务.文中提出了一种将多Agent系统和元学习方法相结合的多Agent元学习框架,应用于生物医学命名实体识别.基层多个学习Agent分别识别不同类型的生物医学命名实体,并通过相关学习Agent之间的通信来交换有益信息以调节个体Agent的行为提高其学习性能,元层Agent综合决策基层学习Agent的学习结果以获得最终的识别结果.元层Agent和基层学习Agent通过局部特征选择法选择适合不同实体类别的敏感特征集合提高了总体识别性能尤其是小类别识别的性能.文中提出的方法有效改善了传统的单一学习模型和全局特征选择方法不能兼顾各类别命名实体识别性能的不足.实验结果表明,文中提出的全新方法在生物医学命名实体识别上取得了优越的性能,在JNLPBA2004测试语料上获得了77.5%的F测度值.
引用
收藏
页码:1256 / 1262
页数:7
相关论文
共 4 条
[1]
A CONDITIONAL RANDOM FIELDS APPROACH TO BIOMEDICAL NAMED ENTITY RECOGNITION [J].
Wang Haochang Zhao Tiejun Li Sheng Yu Hao School of Computer Science and Technology Harbin Institute of Technology Harbin China .
JournalofElectronics(China), 2007, (06) :838-844
[2]
Machine learning in automated text categorization[J] Fabrizio Sebastiani ACM Computing Surveys (CSUR) 2002,
[3]
Using BLAST for identifying gene and protein names in journal articles[J] Michael Krauthammer;Andrey Rzhetsky;Pavel Morozov;Carol Friedman Gene 2000,
[4]
Meta-learning in distributed data mining system:Issues and approaches Prodromidis A L;Chan P K;Stolfo S J; Advances in distributed and parallel Knowledge Discovery 2000,