共 5 条
基于CNN和LSTM混合模型的中文词性标注
被引:21
作者:
谢逸
饶文碧
段鹏飞
陈振东
机构:
[1] 武汉理工大学计算机科学与技术学院
来源:
关键词:
词性标注;
卷积神经网络;
长短期记忆;
实验分析;
D O I:
10.14188/j.1671-8836.2017.03.009
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
中文词性标注具有重要的作用,它的准确性和标注速度直接影响到自然语言处理的后续任务.提出一种基于CNN(convolutional neural network)和LSTM(long-short term memory)混合模型进行中文词性标注.该模型采用三层结构,用词向量和CNN的滑动窗口特性产生词语表示特征,LSTM的时序性来产生词性标注的序列标签.分别在PFR《人民日报》语料库、CTB7.0和CoNLL09语料库上对该模型进行测试,在未加入任何人工特征的条件下,对词语进行词性标注,词性标注效果好于HMM(hidden Markov model)、MLP(multi-layer perceptron)、CNN和LSTM.
引用
收藏
页码:246 / 250
页数:5
相关论文