用于社交媒体的中文命名实体识别

被引:26
作者
李源
马磊
邵党国
袁梅宇
张名芳
机构
[1] 昆明理工大学信息工程与自动化学院
关键词
位置编码; 多种注意力机制; 对抗学习; 中文命名实体识别;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
社交领域的中文命名实体识别(NER)是自然语言处理(NLP)中一项重要的基础任务。目前基于词粒度信息或者外部知识的中文命名实体识别方法,都会受到中文分词(CWS)和溢出词(OOV)等问题的影响。因此,该文提出了一种基于字符的使用位置编码和多种注意力的对抗学习模型。联合使用位置编码和多头注意力能够更好地捕获字序间的依赖关系,而使用空间注意力的判别器则能改善对外部知识的提取效果。该文模型分别在Weibo2015数据集和Weibo2017数据集上进行了实验,实验结果中的F1值分别为56.79%和60.62%。与多个基线模型相比,该文提出的模型性能更优。
引用
收藏
页码:61 / 69
页数:9
相关论文
共 1 条
[1]
Adversarial Transfer Learning for Chinese Named Entity Recognition with Self-Attention Mechanism Pengfei Cao;Yubo Chen;Kang Liu;et al; Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing 2018,