面向知识库问答中复述问句评分的词向量构建方法

被引:5
作者
詹晨迪
凌震华
戴礼荣
机构
[1] 中国科学技术大学语音及语言信息处理国家工程实验室
关键词
知识库问答; 复述问句; 词向量;
D O I
10.16451/j.cnki.issn1003-6059.201609007
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
传统的词向量构建方法基于句子内部单词间的共现概率,采用与具体任务无关的无监督训练方法实现.文中提出基于复述关系约束的词向量构建方法,用于改进知识库问答中基于词向量和词袋模型的复述问句评分.首先从复述问句库中按一定规则收集得到满足复述关系的问句对和不满足复述关系的问句对,以问句对之间的相似度不等式表示句子级的语义约束信息,再将该不等式作为约束项加入词向量训练的目标函数中.实验表明,相比传统词向量构建方法,文中方法可以提高问句间复述关系评价的准确度及知识库问答系统中问题回答的准确度.
引用
收藏
页码:825 / 831
页数:7
相关论文
共 1 条
[1]
CONTEXTUAL CORRELATES OF SEMANTIC SIMILARITY [J].
MILLER, GA ;
CHARLES, WG .
LANGUAGE AND COGNITIVE PROCESSES, 1991, 6 (01) :1-28