基于迁移学习和BiLSTM-CRF的中文命名实体识别

被引:101
作者
武惠 [1 ,2 ]
吕立 [2 ]
于碧辉 [2 ]
机构
[1] 中国科学院大学
[2] 中国科学院沈阳计算技术研究所
关键词
中文命名实体识别; TrBiLSTM-CRF; 迁移学习; 深度学习; 词向量;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP181 [自动推理、机器学习];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
针对中文命名实体识别问题,该文提出了一种基于迁移学习和深度学习的TrBiLSTM-CRF模型.该模型采用基于实例的迁移学习算法,通过权值生成和样本选择,将源域的知识迁移到目标域,有效地解决了深度学习对少量数据学习能力不足的问题;通过词向量、BiLSTM、CRF等操作融合了上下文语义信息,克服了对人工特征和专家知识的依赖.实验结果表明,TrBiLSTMCRF模型在小规模数据集上进行中文机构名命名实体识别时,其准确率、召回率和F值分别为91. 57%、72. 29%和0. 80%,相比于该文提到的其他方法,取得了较好的效果.
引用
收藏
页码:1142 / 1147
页数:6
相关论文
共 6 条
[1]
融合迁移学习的中文命名实体识别 [J].
王红斌 ;
沈强 ;
线岩团 .
小型微型计算机系统, 2017, 38 (02) :346-351
[2]
权值不确定的模糊多属性格序决策方法 [J].
吕智颖 ;
郑理伟 ;
黄天民 ;
翟晓红 .
数学的实践与认识, 2014, 44 (18) :175-181
[3]
迁移学习研究进展 [J].
庄福振 ;
罗平 ;
何清 ;
史忠植 .
软件学报, 2015, 26 (01) :26-39
[4]
Transfer learning for cross-company software defect prediction.[J].Ying Ma;Guangchun Luo;Xue Zeng;Aiguo Chen.Information and Software Technology.2011, 3
[5]
A survey of named entity recognition and classification [J].
Nadeau, David ;
Sekine, Satoshi .
LINGUISTICAE INVESTIGATIONES, 2007, 30 (01) :3-26
[6]
Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780