面向企业图谱构建的中文命名实体识别技术研究

被引:0
作者
王超
机构
[1] 东南大学
关键词
中文命名实体识别; Self-Attention; 迁移学习; 自学习; 主动学习;
D O I
10.27014/d.cnki.gdnau.2019.002403
年度学位
2019
学位类型
硕士
摘要
命名实体识别是信息抽取、机器翻译、知识图谱等应用领域的重要基础工具,在自然语言处理技术走向实用化过程中有着重要地位。在中文命名实体识别研究落后于英文命名实体识别研究以及深度学习兴起的背景下,本文面向企业图谱的构建这一目标,基于深度神经网络模型,深入研究了图谱构建过程中涉及的中文命名实体识别技术。论文的主要工作如下:在经典的BiLSTM-CRF命名实体识别模型的基础上融入Self-Attention,提出了SA-BiLSTM-CRF模型。实验证明该模型能够有效提取远距离依赖信息,有着更好的识别效果。并且发现BiLSTM与Self-Attention结合时使用双向结合的方式比单一结合的方式效果更好。验证了SA-BiLSTM-CRF模型中能够较好地通过LSTM学习到单词位置信息而不需要Positin Embedding。发现Multi-Head机制则能够提升模型效果,但是抽头过多容易过拟合。为了将SA-BiLSTM-CRF模型应用于标注语料较少的企业领域,针对标注语料少、深度网络模型难以训练的问题,分别基于迁移学习、自学习、主动学习、自学习与主动学习相结合四种思路提出了四种优化策略。实验验证了四种优化的有效性。同时,在基于迁移学习的优化策略中,发现最适合的迁移学习方式是迁移和微调整个模型的参数。在其他三种优化策略中,发现使用自学习与主动学习相结合的算法能够优势互补,优化效果要比单一使用其中一种算法的效果更好。在SA-BiLSTM-CRF模型的训练流程中,引入基于迁移学习优化策略和基于自学习与主动学习相结合的优化策略,提出了一个适用于企业领域的命名实体识别系统,并完成了企业图谱的构建。
引用
收藏
页数:60
共 12 条
[1]
统计学习方法.[M].李航; 著.清华大学出版社.2012,
[2]
Self-labeled techniques for semi-supervised learning: taxonomy, software and empirical study [J].
Triguero, Isaac ;
Garcia, Salvador ;
Herrera, Francisco .
KNOWLEDGE AND INFORMATION SYSTEMS, 2015, 42 (02) :245-284
[3]
Efficient Estimation of Word Representations in Vector Space.[J].Tomas Mikolov;Kai Chen 0010;Greg Corrado;Jeffrey Dean.CoRR.2013,
[4]
Semi-Supervised Learning.[J].Chapelle; O.;Scholkopf; B.;Zien; Eds.; A..IEEE Transactions on Neural Networks.2009, 3
[5]
Unsupervised named-entity extraction from the Web: An experimental study [J].
Etzioni, O ;
Cafarella, M ;
Downey, D ;
Popescu, AM ;
Shaked, T ;
Soderland, S ;
Weld, DS ;
Yates, A .
ARTIFICIAL INTELLIGENCE, 2005, 165 (01) :91-134
[6]
An algorithm that learns what's in a name [J].
Bikel, DM ;
Schwartz, R ;
Weischedel, RM .
MACHINE LEARNING, 1999, 34 (1-3) :211-231
[7]
Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780
[8]
FINDING STRUCTURE IN TIME [J].
ELMAN, JL .
COGNITIVE SCIENCE, 1990, 14 (02) :179-211
[9]
知识图谱构建技术综述 [J].
刘峤 ;
李杨 ;
段宏 ;
刘瑶 ;
秦志光 .
计算机研究与发展, 2016, 53 (03) :582-600
[10]
迁移学习研究进展 [J].
庄福振 ;
罗平 ;
何清 ;
史忠植 .
软件学报, 2015, 26 (01) :26-39