反馈式K近邻语义迁移学习的领域命名实体识别

被引:17
作者
朱艳辉 [1 ,2 ]
李飞 [1 ,2 ]
冀相冰 [1 ,2 ]
曾志高 [1 ,2 ]
徐啸 [1 ,2 ]
机构
[1] 湖南工业大学计算机学院
[2] 湖南省智能信息感知及处理技术重点实验室
关键词
领域命名实体识别; 反馈式K近邻; 语义迁移学习; 深度学习; 卷积神经网络; 文档向量; 马哈拉诺比斯距离; 包装领域; 医疗领域;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP18 [人工智能理论];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
领域命名实体识别是构建领域知识图谱的重要基础。针对专业领域语料匮乏的特点,构建基于深度学习的BiLSTM-CNN-CRFs网络模型,并提出一种反馈式K近邻语义迁移学习的领域命名实体识别方法。首先,对专业领域语料和通用领域语料分别训练得到语料文档向量,使用马哈拉诺比斯距离计算领域语料与通用语料的语义相似性,针对每个专业领域样本分别取K个语义最相似的通用领域样本进行语义迁移学习,构建多个迁移语料集。然后,使用BiLSTM-CNN-CRFs网络模型对迁移语料集进行领域命名实体识别,并对识别结果进行评估和前馈,根据反馈结果选取合适的K值,作为语义迁移学习的最佳阈值。以包装领域和医疗领域为例进行实验验证,结果表明:本文方法取得了很好的识别效果,可以有效解决专业领域语料匮乏问题。
引用
收藏
页码:820 / 830
页数:11
相关论文
共 6 条
[1]
基于相似度学习的多源迁移算法 [J].
卞则康 ;
王士同 .
控制与决策 , 2017, (11) :1941-1948
[2]
基于深度神经网络的中文命名实体识别 [J].
张海楠 ;
伍大勇 ;
刘悦 ;
程学旗 .
中文信息学报, 2017, 31 (04) :28-35
[3]
词边界字向量的中文命名实体识别 [J].
姚霖 ;
刘轶 ;
李鑫鑫 ;
刘宏 .
智能系统学报, 2016, 11 (01) :37-42
[4]
迁移学习研究进展 [J].
庄福振 ;
罗平 ;
何清 ;
史忠植 .
软件学报, 2015, 26 (01) :26-39
[5]
马氏度量学习中的几个关键问题研究及几何解释 [J].
杨绪兵 ;
王一雄 ;
陈斌 .
南京大学学报(自然科学版), 2013, 49 (02) :133-141
[6]
Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780