基于深度神经网络的命名实体识别方法研究

被引:15
作者
GUL Khan Safi Qamas
尹继泽
潘丽敏
罗森林
机构
[1] 北京理工大学信息系统及安全对抗实验中心
关键词
命名实体识别; 中文社交媒体; 深度神经网络; 注意力机制;
D O I
暂无
中图分类号
TP183 [人工神经网络与计算]; TP391.1 [文字信息处理];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 081203 ;
摘要
针对中文社交媒体命名实体识别的特征提取不充分问题,文章提出一种基于深度神经网络、结合长短时记忆和注意力模型的命名实体识别方法。一条社交媒体文本信息等价于一个字符序列,因此,首先将其中每个字符转化为对应的字向量;其次,利用长短时记忆处理转化后的字向量序列来提取文本全局特征;然后,利用注意力模型处理前一步输出的文本全局特征向量序列,进一步提取文本局部特征;最后,利用线性链式条件随机场根据文本全局和局部特征向量序列进行命名实体标注,获得命名实体识别结果并输出。实验结果表明,文中方法与基线算法及当前优良算法相比,其F-测度值高于其他对比方法。
引用
收藏
页码:29 / 35
页数:7
相关论文
共 8 条
[1]   基于图结构的文本表示方法研究 [J].
任浩 ;
罗森林 ;
潘丽敏 ;
高君丰 .
信息网络安全, 2017, (03) :46-52
[2]   基于Word2vec的微博短文本分类研究 [J].
张谦 ;
高章敏 ;
刘嘉勇 .
信息网络安全, 2017, (01) :57-62
[3]   基于句义成分的短文本表示方法研究 [J].
尚海 ;
罗森林 ;
韩磊 ;
张笈 .
信息网络安全, 2016, (05) :64-70
[4]  
机器学习[M]. 清华大学出版社 , 周志华, 2016
[5]  
Product named entity recognition for Chinese query questions based on a skip-chain CRF model[J] . Zhifeng Hao,Hongfei Wang,Ruichu Cai,Wen Wen.Neural Computing and Applications . 2013 (2)
[6]  
An Algorithm that Learns What's in a Name[J] . Daniel M. Bikel,Richard Schwartz,Ralph M. Weischedel.Machine Learning . 1999 (1-3)
[7]   Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780
[8]  
Efficient support vector classifiers for named entity recognition .2 Isozaki H,Kazawa H. Proceedings of the 19th international conference on Computational linguistics . 2002