基于深度神经网络的中文命名实体识别

被引:177
作者
张海楠 [1 ]
伍大勇 [1 ]
刘悦 [1 ]
程学旗 [2 ]
机构
[1] 中国科学院计算技术研究所
[2] 烟台中科网络技术研究所
关键词
命名实体识别; 深度学习; 神经网络; 机器学习; 词性;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
由于中文词语缺乏明确的边界和大小写特征,单字在不同词语下的意思也不尽相同,较于英文,中文命名实体识别显得更加困难。该文利用词向量的特点,提出了一种用于深度学习框架的字词联合方法,将字特征和词特征统一地结合起来,它弥补了词特征分词错误蔓延和字典稀疏的不足,也改善了字特征因固定窗口大小导致的上下文缺失。在词特征中加入词性信息后,进一步提高了系统的性能。在1998年《人民日报》语料上的实验结果表明,该方法达到了良好的效果,在地名、人名、机构名识别任务上分别提高1.6%、8%、3%,加入词性特征的字词联合方法的F1值可以达到96.8%、94.6%、88.6%。
引用
收藏
页码:28 / 35
页数:8
相关论文
共 4 条
[1]
中文微博命名实体识别 [J].
邱泉清 ;
苗夺谦 ;
张志飞 .
计算机科学, 2013, 40 (06) :196-198
[2]
汉英双语命名实体识别与对齐的交互式方法 [J].
陈钰枫 ;
宗成庆 ;
苏克毅 .
计算机学报, 2011, 34 (09) :1688-1696
[3]
命名实体识别、排歧和跨语言关联 [J].
赵军 .
中文信息学报, 2009, 23 (02) :3-17
[4]
An algorithm that learns what's in a name [J].
Bikel, DM ;
Schwartz, R ;
Weischedel, RM .
MACHINE LEARNING, 1999, 34 (1-3) :211-231