基于LSTM的食品安全自动问答系统方法研究

被引:11
作者
陈瑛
陈昂轩
董玉博
赵筱钰
侯文俊
机构
[1] 中国农业大学信息与电气工程学院
关键词
食品安全; 问答系统; 答案抽取模型; LSTM技术; 深度学习;
D O I
暂无
中图分类号
TS201.6 [食品安全与卫生]; TP391.1 [文字信息处理];
学科分类号
100403 ;
摘要
为高效、准确、全面获取食品安全相关信息,以食品安全文本为研究对象,采用Lucene全文检索架构和长短期记忆神经网络(Long short-term memory,LSTM)构建了食品安全自动问答系统。依托于从互联网爬取的文本作为非结构化数据集,利用检索架构扩充人工标注的问题答案对规模,并以此训练了可以判断问题和答案候选句匹配程度的LSTM模型。基于Lucene检索机制进行答案候选集提取和基于LSTM模型进行答案提取,构建了一个可根据食品安全相关问题给出答案所在句子的问答系统,并对比了基于Lucene直接检索的答案抽取和基于LSTM的答案抽取这两种方法。结果表明,当候选文档数量增加时,基于LSTM模型的问题答案匹配方法,其平均准确度始终高于基于Lucene检索方法的平均准确度;而候选句子数量较小时,基于LSTM模型的问题答案匹配方法的平均准确度也高于基于Lucene检索方法的平均准确度。
引用
收藏
页码:380 / 384
页数:5
相关论文
共 29 条
  • [1] Overview of the TREC 2001 Question Answering Track. E.M. Voorhees. The Tenth Text REtrieval Conference (TREC 10) . 2001
  • [2] Evaluating Question-Answering Techniques in Chinese. Li Xiaoyan,,W.Bruce Croft. Proceedings of First International Conference on Human Language Technology Research . 2001
  • [3] 问答式检索技术及评测研究综述
    吴友政
    赵军
    段湘煜
    徐波
    [J]. 中文信息学报, 2005, (03) : 1 - 13
  • [4] 基于Lucene全文检索引擎的应用研究与实现
    管建和
    甘剑峰
    [J]. 计算机工程与设计, 2007, (02) : 489 - 491
  • [5] 问答系统研究综述
    毛先领
    李晓明
    [J]. 计算机科学与探索, 2012, (03) : 193 - 207
  • [6] ICT Experiments in TREC 11 QA Main Task. Xu H,Zhang H,Bai S. TREC . 2002
  • [7] The effect of document retrieval quality on factoid question answering performance. COLLINS-THOMPSON K,CALLAN J,TERRA Eet al. Proceedings of the 27th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 04) . 2004
  • [8] Gradient flow in recurrent nets:the difficulty of learning long term dependencies. KOLEN J F,KREMER S C. . 2001
  • [9] Reducing approximation and estimation errors for Chinese lexical processing with heterogeneous annotations. SUN Weiwei,WAN Xiaojun. Proceedings Association for Computational Linguistics . 2012
  • [10] FDU at TREC 2002:filtering Q&A web and video tasks. WU Lide,HUANG Xuanjing,NIU Junyuet al. 11th Text REtrieval Conference . 2002