基于LSTM的食品安全自动问答系统方法研究

被引:11
作者
陈瑛
陈昂轩
董玉博
赵筱钰
侯文俊
机构
[1] 中国农业大学信息与电气工程学院
关键词
食品安全; 问答系统; 答案抽取模型; LSTM技术; 深度学习;
D O I
暂无
中图分类号
TS201.6 [食品安全与卫生]; TP391.1 [文字信息处理];
学科分类号
100403 ;
摘要
为高效、准确、全面获取食品安全相关信息,以食品安全文本为研究对象,采用Lucene全文检索架构和长短期记忆神经网络(Long short-term memory,LSTM)构建了食品安全自动问答系统。依托于从互联网爬取的文本作为非结构化数据集,利用检索架构扩充人工标注的问题答案对规模,并以此训练了可以判断问题和答案候选句匹配程度的LSTM模型。基于Lucene检索机制进行答案候选集提取和基于LSTM模型进行答案提取,构建了一个可根据食品安全相关问题给出答案所在句子的问答系统,并对比了基于Lucene直接检索的答案抽取和基于LSTM的答案抽取这两种方法。结果表明,当候选文档数量增加时,基于LSTM模型的问题答案匹配方法,其平均准确度始终高于基于Lucene检索方法的平均准确度;而候选句子数量较小时,基于LSTM模型的问题答案匹配方法的平均准确度也高于基于Lucene检索方法的平均准确度。
引用
收藏
页码:380 / 384
页数:5
相关论文
共 29 条