学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于特征耦合泛化的药名实体识别
被引:21
作者
:
论文数:
引用数:
h-index:
机构:
何林娜
[
1
]
论文数:
引用数:
h-index:
机构:
杨志豪
[
1
]
论文数:
引用数:
h-index:
机构:
林鸿飞
[
1
]
论文数:
引用数:
h-index:
机构:
李彦鹏
[
1
]
论文数:
引用数:
h-index:
机构:
唐利娟
[
2
]
机构
:
[1]
大连理工大学计算机科学与技术学院
[2]
山东省农业管理干部学院机械电子工程系
来源
:
中文信息学报
|
2014年
/ 02期
基金
:
中央高校基本科研业务费专项资金资助;
高等学校博士学科点专项科研基金;
关键词
:
药名识别;
机器学习;
特征耦合泛化;
CRF;
D O I
:
暂无
中图分类号
:
TP391.41 [];
学科分类号
:
摘要
:
药名识别的直接目的是从生物医学文本中寻找药名。目前,药物相关研究不断出现,远远超出了维护人员更新药物信息数据库的速度,这就迫切需要一种自动提取药物信息的技术。该文采用了一种基于特征耦合泛化(FCG)的半监督学习方法生成药名词典,然后将药名词典和条件随机场结合进行药名实体识别。首先我们用模板的方法构造了一个药名词典,然后用FCG方法对词典去噪,最后将去噪后的词典用在测试集上进行药名实体识别,得到了76.73%的F值。
引用
收藏
页码:72 / 77
页数:6
相关论文
共 3 条
[1]
生物医学命名实体识别的研究与进展
[J].
郑强
论文数:
0
引用数:
0
h-index:
0
机构:
国防科学技术大学并行与分布处理国家重点实验室
军事医学科学院放射与辐射医学研究所北京蛋白质组研究中心蛋白质组学国家重点实验室
国防科学技术大学并行与分布处理国家重点实验室
郑强
;
论文数:
引用数:
h-index:
机构:
刘齐军
;
论文数:
引用数:
h-index:
机构:
王正华
;
朱云平
论文数:
0
引用数:
0
h-index:
0
机构:
军事医学科学院放射与辐射医学研究所北京蛋白质组研究中心蛋白质组学国家重点实验室
国防科学技术大学并行与分布处理国家重点实验室
朱云平
.
计算机应用研究,
2010,
27
(03)
:811
-815+832
[2]
生物文本中蛋白质名称的识别
[J].
论文数:
引用数:
h-index:
机构:
王浩畅
;
论文数:
引用数:
h-index:
机构:
赵铁军
;
论文数:
引用数:
h-index:
机构:
于浩
.
计算机应用研究,
2007,
(01)
:100
-102
[3]
Drug name recognition and classification in biomedical texts[J] Isabel Segura-Bedmar;Paloma Martínez;María Segura-Bedmar Drug Discovery Today 2008,
←
1
→
共 3 条
[1]
生物医学命名实体识别的研究与进展
[J].
郑强
论文数:
0
引用数:
0
h-index:
0
机构:
国防科学技术大学并行与分布处理国家重点实验室
军事医学科学院放射与辐射医学研究所北京蛋白质组研究中心蛋白质组学国家重点实验室
国防科学技术大学并行与分布处理国家重点实验室
郑强
;
论文数:
引用数:
h-index:
机构:
刘齐军
;
论文数:
引用数:
h-index:
机构:
王正华
;
朱云平
论文数:
0
引用数:
0
h-index:
0
机构:
军事医学科学院放射与辐射医学研究所北京蛋白质组研究中心蛋白质组学国家重点实验室
国防科学技术大学并行与分布处理国家重点实验室
朱云平
.
计算机应用研究,
2010,
27
(03)
:811
-815+832
[2]
生物文本中蛋白质名称的识别
[J].
论文数:
引用数:
h-index:
机构:
王浩畅
;
论文数:
引用数:
h-index:
机构:
赵铁军
;
论文数:
引用数:
h-index:
机构:
于浩
.
计算机应用研究,
2007,
(01)
:100
-102
[3]
Drug name recognition and classification in biomedical texts[J] Isabel Segura-Bedmar;Paloma Martínez;María Segura-Bedmar Drug Discovery Today 2008,
←
1
→