基于深度学习的中文命名实体识别研究

被引:0
作者
王国昱
机构
[1] 北京工业大学
关键词
中文命名实体识别; 深度学习; 深层神经网络; 自编码神经网络; 增量学习;
D O I
暂无
年度学位
2015
学位类型
硕士
导师
摘要
中文命名实体识别是自然语言处理领域中的基本任务之一,也是自动问答、信息抽取等自然语言处理综合应用中的基础环节。近十几年来,国内外学者对文本中的实体识别技术已有广泛探讨和深入研究。但随着互联网的飞速发展,大量无规则、多领域的文本数据不断增长,对命名实体识别技术提出了新的要求。本文主要工作如下:(1)对国内外命名实体识别的解决方法进行了调查研究,分析了当今主流模型方法与技术发展趋势。在总结当前主流方法的缺陷和中文命名实体识别的特殊性的同时,指出了利用深度学习的相关理论来解决中文命名实体识别问题的新思路。(2)提出了一种基于堆叠式自编码分类器的深层神经网络模型,对该模型在命名实体识别任务中的应用进行了深入研究。解决了从中文文本序列到模型输入向量的转化问题,推导了便于工程实现的向量化前向-后向传播公式。同时,总结了一套行之有效的参数初始化与调参方法,优化了模型训练过程与实体标注效果。(3)在建立模型的基础上,进行了大量的对比实验。实验结果表明,这种深层神经网络标注模型具有良好的中文实体识别效果,在人民日报语料集上的测试效果达到了当前最好水平。特别在地名、机构名的识别方面比条件随机场模型更具优势,地名与机构名的识别召回率比条件随机场的识别结果分别提升了9.60%、8.84%,F值分别提升了3.76%、2.35%。(4)实现了基于深层神经网络模型的中文命名实体识别系统。提出了增量学习的半自动化处理流程:系统结合边界熵与增量训练的半监督后处理方法,用以替代过去规则与统计结合的传统框架。解决了实践中中文标注语料匮乏、训练开销与维护成本较大的问题,使其能够在少量人工干预的前提下,快速有效地处理海量中文数据。实践表明,基于深度学习理论的神经网络模型能够很好的应用于中文命名实体识别任务。以该模型为核心建立的中文命名实体识别系统具有良好的健壮性和可维护性,能够满足大数据背景下中文命名实体识别的新需求。
引用
收藏
页数:65
共 12 条
[1]
Natural Language Processing: A Human-Computer Interaction Perspective.[J].Bill Manaris.Advances In Computers.1998,
[2]
THE BASIC IDEAS IN NEURAL NETWORKS [J].
RUMELHART, DE ;
WIDROW, B ;
LEHR, MA .
COMMUNICATIONS OF THE ACM, 1994, 37 (03) :87-92
[3]
统计学习方法.[M].李航; 著.清华大学出版社.2012,
[4]
自然语言理解与机器翻译.[M].黄昌宁;张普主编;.清华大学出版社.2001,
[5]
MUC-6;the Sixth in a Series of Message Understanding Conferences;was held in November1995...http://cs.nyu.edu/cs/faculty/grishman/muc6.html.,
[6]
Description of the NTU system used for MET2..CHEN H H;DINGY W;TSAI SC;.Proceedings of the 7th Message Understanding Conference.1998,
[7]
统计和规则相结合的中文机构名称识别.[A].张艳丽;黄德根;张丽静;杨元生;.全国第六届计算语言学联合学术会议.2001,
[8]
基于层叠条件随机场模型的中文机构名自动识别 [J].
周俊生 ;
戴新宇 ;
尹存燕 ;
陈家骏 .
电子学报, 2006, (05) :804-809
[9]
基于层叠隐马尔可夫模型的中文命名实体识别 [J].
俞鸿魁 ;
张华平 ;
刘群 ;
吕学强 ;
施水才 .
通信学报, 2006, (02) :87-94
[10]
基于层叠隐马模型的汉语词法分析 [J].
刘群 ;
张华平 ;
俞鸿魁 ;
程学旗 .
计算机研究与发展, 2004, (08) :1421-1429