基于BiLSTM-CNN-CRF模型的维吾尔文命名实体识别

被引:53
作者
买买提阿依甫
吾守尔·斯拉木
帕丽旦·木合塔尔
杨文忠
机构
[1] 新疆大学信息科学与工程学院
关键词
递归神经网络; 卷积神经网络; 条件随机场; 维吾尔文; 命名实体识别;
D O I
10.19678/j.issn.1000-3428.0050502
中图分类号
TP183 [人工神经网络与计算]; TP391.1 [文字信息处理];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
为在缺乏资源和不依赖人工特征的情况下提高维吾尔文命名实体的识别性能,构建基于BiLSTM-CNNCRF的神经网络模型。采用卷积神经网络训练具有维吾尔文单词的后缀、前缀等形态特征的字符向量,利用skipgram模型对大规模语料进行训练,生成具有语义信息的低维度稠密实数词向量。在此基础上,将字符向量、词性向量和词向量拼接的向量作为输入,构建适合维吾尔文命名实体识别的BiLSTM-CRF深层神经网络。实验结果表明,该模型能够解决命名实体的自动识别问题,具有较强的鲁棒性,F1值达到91.89%。
引用
收藏
页码:230 / 236
页数:7
相关论文
共 5 条
[1]
基于Word2vec的自然语言隐写分析方法 [J].
喻靖民 ;
向凌云 ;
曾道建 .
计算机工程, 2019, 45 (03) :309-314
[2]
基于卷积双向长短期记忆网络的事件触发词抽取 [J].
陈斌 ;
周勇 ;
刘兵 .
计算机工程, 2019, 45 (01) :153-158
[3]
基于深度神经网络的中文命名实体识别 [J].
张海楠 ;
伍大勇 ;
刘悦 ;
程学旗 .
中文信息学报, 2017, 31 (04) :28-35
[4]
[5]
基于条件随机场的维吾尔人名识别方法 [J].
艾斯卡尔肉孜 ;
宗成庆 ;
姑丽加玛丽麦麦提艾力 ;
热合木马合木提 ;
艾斯卡尔艾木都拉 .
清华大学学报(自然科学版), 2013, 53 (06) :873-877