基于CNN与双向LSTM的中文文本蕴含识别方法

被引:23
作者
谭咏梅 [1 ]
刘姝雯 [1 ]
吕学强 [2 ]
机构
[1] 北京邮电大学计算机学院
[2] 北京信息科技大学网络文化与数字传播北京市重点实验室
关键词
中文文本蕴含; 卷积神经网络; 双向长短时记忆网络;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP391.1 [文字信息处理];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
为了避免基于传统机器学习的中文文本蕴含识别方法需要人工筛选大量特征以及使用多种自然语言处理工具造成的错误累计问题,该文提出了基于CNN与双向LSTM的中文文本蕴含识别方法。该方法使用CNN与双向LSTM分别对句子进行编码,自动提取相关特征,然后使用全连接层进行分类得到初步的识别结果,最后使用语义规则对网络识别结果进行修正,得到最终的蕴含识别结果。在2014年RITE-VAL评测任务的数据集上MacroF1结果为61.74%,超过评测第一名的结果61.51%。实验结果表明,该方法对于中文文本蕴含识别是有效的。
引用
收藏
页码:11 / 19
页数:9
相关论文
共 9 条
  • [1] 文本蕴含关系识别与知识获取研究进展及展望
    郭茂盛
    张宇
    刘挺
    [J]. 计算机学报, 2017, 40 (04) : 889 - 910
  • [2] 基于事件语义特征的中文文本蕴含识别
    刘茂福
    李妍
    姬东鸿
    [J]. 中文信息学报, 2013, (05) : 129 - 136
  • [3] 基于深度神经网络的文本蕴含识别及应用研究[D]. 王宝鑫.哈尔滨工业大学 2016
  • [4] 文本蕴含识别研究[D]. 王志浩.北京邮电大学 2015
  • [5] Structured prediction models for RNN based sequence labeling in clinical text[J] . Jagannatha Abhyuday N,Yu Hong.Proceedings of the Conference on Empirical Methods in Natural Language Processing. Conference on Empirical Methods in Natural Language Processing . 2016
  • [6] Framewise phoneme classification with bidirectional LSTM and other neural network architectures[J] . Alex Graves,Jürgen Schmidhuber.Neural Networks . 2005 (5)
  • [7] Gradient-based learning applied to document recognition
    Lecun, Y
    Bottou, L
    Bengio, Y
    Haffner, P
    [J]. PROCEEDINGS OF THE IEEE, 1998, 86 (11) : 2278 - 2324
  • [8] Long short-term memory
    Hochreiter, S
    Schmidhuber, J
    [J]. NEURAL COMPUTATION, 1997, 9 (08) : 1735 - 1780
  • [9] Gradient Flow in Recurrent Nets:the Difficulty of Learning Long-Term Dependencies. Kolen John,Kremer Stefan. Wiley-IEEE Press . 2007