基于深度神经网络的有色金属领域实体识别

被引:13
作者
毛存礼 [1 ]
余正涛 [1 ]
沈韬 [2 ]
高盛祥 [1 ]
郭剑毅 [1 ]
线岩团 [1 ]
机构
[1] 昆明理工大学信息工程与自动化学院
[2] 昆明理工大学材料科学与工程学院
关键词
有色金属领域; 深度神经网络; 词汇embeddings; 降噪自动编码器; 实体识别;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
针对有色金属领域实体识别问题,提出一种基于深度神经网络(deep neural network,DNN)架构的有色金属领域实体识别方法.为能有效获取有色金属领域实体中字符间的紧密结合特征,并回避专业领域中文分词问题,使用神经网络的方法自动学习中文字符embeddings向量化表示作为模型输入.基于降噪自动编码器(denoising autoencoder,DAE)对深度神经网络的每个隐层进行逐层预训练获取用于有色金属领域实体识别的最优特征向量组合,并详细介绍了基于神经语言模型的文本窗口降噪自动编码器预训练及有色金属实体识别的深层网络构建过程.为验证方法的有效性,对有色金属领域产品名、矿产名、地名、组织机构4类实体识别进行实验.实验结果表明,提出的方法对于专业领域的实体识别具有较好的效果.
引用
收藏
页码:2451 / 2459
页数:9
相关论文
共 6 条
[1]   玻尔兹曼机研究进展 [J].
刘建伟 ;
刘媛 ;
罗雄麟 .
计算机研究与发展, 2014, 51 (01) :1-16
[2]   深度学习的昨天、今天和明天 [J].
余凯 ;
贾磊 ;
陈雨强 ;
徐伟 .
计算机研究与发展, 2013, 50 (09) :1799-1804
[3]   基于Deep Belief Nets的中文名实体关系抽取 [J].
陈宇 ;
郑德权 ;
赵铁军 .
软件学报, 2012, 23 (10) :2572-2585
[4]   面向商务信息抽取的产品命名实体识别研究 [J].
刘非凡 ;
赵军 ;
吕碧波 ;
徐波 ;
于浩 ;
夏迎炬 .
中文信息学报, 2006, (01) :7-13
[5]  
Efficient Estimation of Word Representations in Vector Space .2 Mikolov T,Chen K,Corrado G,et al. Proceedings of Workshop at ICLR . 2013
[6]  
Named entity recognition using an HMM-based chunk tagger .2 Zhou GuoDong,Su Jian. proceedings of the 40th Annual Meeting on Association for Computational Linguistics . 2002