基于特征耦合泛化的药名实体识别

被引:21
作者
何林娜 [1 ]
杨志豪 [1 ]
林鸿飞 [1 ]
李彦鹏 [1 ]
唐利娟 [2 ]
机构
[1] 大连理工大学计算机科学与技术学院
[2] 山东省农业管理干部学院机械电子工程系
基金
中央高校基本科研业务费专项资金资助; 高等学校博士学科点专项科研基金;
关键词
药名识别; 机器学习; 特征耦合泛化; CRF;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
摘要
药名识别的直接目的是从生物医学文本中寻找药名。目前,药物相关研究不断出现,远远超出了维护人员更新药物信息数据库的速度,这就迫切需要一种自动提取药物信息的技术。该文采用了一种基于特征耦合泛化(FCG)的半监督学习方法生成药名词典,然后将药名词典和条件随机场结合进行药名实体识别。首先我们用模板的方法构造了一个药名词典,然后用FCG方法对词典去噪,最后将去噪后的词典用在测试集上进行药名实体识别,得到了76.73%的F值。
引用
收藏
页码:72 / 77
页数:6
相关论文
共 3 条
[1]
生物医学命名实体识别的研究与进展 [J].
郑强 ;
刘齐军 ;
王正华 ;
朱云平 .
计算机应用研究, 2010, 27 (03) :811-815+832
[2]
生物文本中蛋白质名称的识别 [J].
王浩畅 ;
赵铁军 ;
于浩 .
计算机应用研究, 2007, (01) :100-102
[3]
Drug name recognition and classification in biomedical texts[J] Isabel Segura-Bedmar;Paloma Martínez;María Segura-Bedmar Drug Discovery Today 2008,