Trans-NER:一种迁移学习支持下的中文命名实体识别模型

被引:30
作者
王银瑞
彭敦陆
陈章
刘丛
机构
[1] 上海理工大学光电信息与计算机工程学院
关键词
自然语言处理; 命名实体识别; 深度学习; 迁移学习;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP181 [自动推理、机器学习];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
目前存在的中文命名实体识别方法依赖于大量标注数据,但是某些领域标注数据的获取成本十分高昂.通过引入迁移学习技术,降低了实体识别模型对于大量标注数据的需求.论文从大规模非结构化文本数据出发,利用双向循环神经网络构建语言预测模型,将其作为迁移学习源模型;同时,基于上下文特征的字符级向量生成算法迁移源模型知识至实体识别模型,最终构建出迁移学习模型:Trans-NER.实验结果显示,提出的模型表现优于其他实体识别模型.
引用
收藏
页码:1622 / 1626
页数:5
相关论文
共 3 条
[1]
利用机器学习方法对神经肌肉罕见病DMD进行分类预测 [J].
章鸣嬛 ;
陈瑛 ;
沈瑛 ;
马军山 .
上海理工大学学报, 2016, 38 (02) :154-159
[2]
迁移学习研究进展 [J].
庄福振 ;
罗平 ;
何清 ;
史忠植 .
软件学报, 2015, 26 (01) :26-39
[3]
A survey of named entity recognition and classification [J].
Nadeau, David ;
Sekine, Satoshi .
LINGUISTICAE INVESTIGATIONES, 2007, 30 (01) :3-26