融合预训练模型的中文知识图谱问题生成方法

被引:6
作者
叶子 [1 ]
陈小平 [1 ]
张波 [2 ]
欧阳昱 [2 ]
刘辉舟 [2 ]
机构
[1] 中国科学技术大学计算机科学与技术学院
[2] 国网安徽省电力有限公司
基金
国家重点研发计划;
关键词
知识图谱; 问题生成; 预训练模型; 条件变分自编码器;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
基于知识图谱的问答方法旨在通过知识图谱的三元组检索和推断来对自然语言形式的问题进行解答.然而,现有中文知识图谱问答语料库存在规模较小,质量较差等问题,相关语料库构建方法亟待完善.因此,本文提出一种融合预训练模型的中文知识图谱问题生成方法,目标是以中文知识图谱三元组作为输入生成正确且多样的问题.该方法汲取了条件变分自编码器的思想,以预编码器-源编码器-解码器为核心架构,利用BERT模型进行预编码,并以Transformer模型为基础构建源编码器和解码器.此外,该方法还结合了答案编码技术并进行了改进.本文使用NLPCC2017 KBQA数据集进行实验,实验表明该模型在BLEU、ROUGE以及人工评价指标上较基线模型有明显提升,并且能够生成更具多样性的问题,证明了该方法的有效性.
引用
收藏
页码:246 / 250
页数:5
相关论文
共 4 条
  • [1] 智能对话系统研究综述
    贾熹滨
    李让
    胡长建
    陈军成
    [J]. 北京工业大学学报, 2017, 43 (09) : 1344 - 1356
  • [2] 知识图谱技术综述
    徐增林
    盛泳潘
    贺丽荣
    王雅芳
    [J]. 电子科技大学学报 , 2016, (04) : 589 - 606
  • [3] Capturing Greater Context for Question Generation..[J].Luu Anh Tuan;Darsh J. Shah;Regina Barzilay.CoRR.2019,
  • [4] Auto-Encoding Variational Bayes..[J].Diederik P. Kingma;Max Welling.CoRR.2013,