基于双向LSTM神经网络模型的中文分词

被引:40
作者
金宸 [1 ]
李维华 [1 ]
姬晨 [1 ]
金绪泽 [2 ]
郭延哺 [1 ]
机构
[1] 云南大学信息学院
[2] 河南师范大学教育学院
关键词
中文分词; 自然语言处理; 双向LSTM; 贡献率;
D O I
暂无
中图分类号
TP183 [人工神经网络与计算]; TP391.1 [文字信息处理];
学科分类号
摘要
中文分词是中文自然语言处理的基础。分词质量的好坏直接影响之后的自然语言处理任务。目前主流的分词是基于传统的机器学习模型。近年来,随着人工智能大潮的又一次兴起,长短期记忆(LSTM)神经网络模型改进了普通循环神经网络模型无法长期依赖信息的缺点,被广泛应用于自然语言处理的各种任务中,并取得了不错的效果。对中文分词,该文在经典单向LSTM模型上进行改进,增加了自后向前的LSTM层,设计了双向LSTM模型,改进了单向LSTM对后文依赖性不足的缺点;并引入了贡献率α,对前传LSTM层和后传LSTM层的权重矩阵进行调节,并设计了四个实验,验证了所建模型的正确性和优越性。
引用
收藏
页码:29 / 37
页数:9
相关论文
共 9 条
[1]   基于LSTM网络的序列标注中文分词法 [J].
任智慧 ;
徐浩煜 ;
封松林 ;
周晗 ;
施俊 .
计算机应用研究, 2017, 34 (05) :1321-1324+1341
[2]   基于层叠CRF模型的词结构分析 [J].
方艳 ;
周国栋 .
中文信息学报, 2015, 29 (04) :1-7+24
[3]   基于最大间隔马尔可夫网模型的汉语分词方法 [J].
李月伦 ;
常宝宝 .
中文信息学报, 2010, 24 (01) :8-14
[4]   基于CRFs边缘概率的中文分词 [J].
罗彦彦 ;
黄德根 .
中文信息学报, 2009, (05) :3-8
[5]   基于有效子串标注的中文分词 [J].
赵海 ;
揭春雨 .
中文信息学报, 2007, (05) :8-13
[6]   中文分词十年回顾 [J].
黄昌宁 ;
赵海 .
中文信息学报, 2007, (03) :8-19
[7]   书面汉语自动分词系统—CDWS [J].
梁南元 .
中文信息学报, 1987, (02) :44-52
[8]  
Framewise phoneme classification with bidirectional LSTM and other neural network architectures[J] . Alex Graves,Jürgen Schmidhuber.Neural Networks . 2005 (5)
[9]   Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780