深度文本匹配综述

被引:66
作者
庞亮 [1 ,2 ,3 ]
兰艳艳 [1 ,2 ]
徐君 [1 ,2 ]
郭嘉丰 [1 ,2 ]
万圣贤 [1 ,2 ,3 ]
程学旗 [1 ,2 ]
机构
[1] 中国科学院网络数据科学与技术重点实验室
[2] 中国科学院计算技术研究所
[3] 中国科学院大学
基金
国家自然科学基金重点项目;
关键词
文本匹配; 深度学习; 自然语言处理; 卷积神经网络; 循环神经网络; 社会媒体;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
自然语言理解的许多任务,例如信息检索、自动问答、机器翻译、对话系统、复述问题等等,都可以抽象成文本匹配问题.过去研究文本匹配主要集中在人工定义特征之上的关系学习,模型的效果很依赖特征的设计.最近深度学习自动从原始数据学习特征的思想也影响着文本匹配领域,大量基于深度学习的文本匹配方法被提出,作者称这类模型为深度文本匹配模型.相比于传统方法,深度文本匹配模型能够从大量的样本中自动提取出词语之间的关系,并能结合短语匹配中的结构信息和文本匹配的层次化特性,更精细地描述文本匹配问题.根据特征提取的不同结构,深度文本匹配模型可以分为3类:基于单语义文档表达的深度学习模型、基于多语义文档表达的深度学习模型和直接建模匹配模式的深度学习模型.从文本交互的角度,这3类模型具有递进的关系,并且对于不同的应用,具有各自性能上的优缺点.该文在复述问题、自动问答和信息检索3个任务上的经典数据集上对深度文本匹配模型进行了实验,比较并详细分析了各类模型的优缺点.最后该文对深度文本模型未来发展的若干问题进行了讨论和分析.
引用
收藏
页码:985 / 1003
页数:19
相关论文
共 13 条
[1]   基于LDA模型的Ad hoc信息检索方法研究 [J].
卜质琼 ;
郑波尽 .
计算机应用研究, 2015, 32 (05) :1369-1372
[2]   语法和语义相结合的中文对话系统问题理解研究 [J].
黄沛杰 ;
黄强 ;
吴秀鹏 ;
吴桂盛 ;
郭庆文 ;
陈楠挺 ;
陈楚萍 .
中文信息学报, 2014, (06) :70-78
[3]   一种面向社区型问句检索的主题翻译模型 [J].
张伟男 ;
张宇 ;
刘挺 .
计算机学报, 2015, 38 (02) :313-321
[4]   任务型人机对话系统中的认知技术——概念、进展及其未来 [J].
俞凯 ;
陈露 ;
陈博 ;
孙锴 ;
朱苏 .
计算机学报, 2015, 38 (12) :2333-2348
[5]   问答式检索技术及评测研究综述 [J].
吴友政 ;
赵军 ;
段湘煜 ;
徐波 .
中文信息学报, 2005, (03) :1-13
[6]   自动问答综述 [J].
郑实福 ;
刘挺 ;
秦兵 ;
李生 .
中文信息学报, 2002, (06) :46-52
[7]  
Deep sentence embedding using long short-term memory networks[J] . Hamid Palangi,Li Deng,Yelong Shen,Jianfeng Gao,Xiaodong He,Jianshu Chen,Xinying Song,Rabab Ward.IEEE/ACM Transactions on Audio, Speech and Langua . 2016 (4)
[8]  
Framewise phoneme classification with bidirectional LSTM and other neural network architectures[J] . Alex Graves,Jürgen Schmidhuber.Neural Networks . 2005 (5)
[9]  
Canonical Correlation Analysis: An Overview with Application to Learning Methods[J] . David R. Hardoon,Sandor Szedmak,John Shawe-Taylor.Neural Computation . 2004 (12)
[10]   Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780