基于知识图谱的旅游问答系统研究与实现

被引:0
作者
张楚婷
机构
[1] 桂林电子科技大学
关键词
旅游领域; 知识图谱; 问答系统; BiLSTM-CRF;
D O I
暂无
年度学位
2019
学位类型
硕士
导师
摘要
目前互联网技术和人工智能技术正处于高速发展阶段,“互联网+传统行业”的模式在各个领域越来越占据着重要的地位。以旅游业为例,大力发展“互联网+旅游”模式,运用大数据、深度学习等前沿技术创新旅游业管理模式,已逐渐成为我国旅游发展的重要环节。以往人们在旅游高峰期游览景区时,需要通过人工咨询的方式获取信息。而以自然语言处理技术为核心的问答系统的出现,让人们游览景区时减少了不必要的时间消耗。与传统的基于搜索引擎的信息检索方式相比,问答系统能返回给用户更简洁更准确的答案,一定程度上提高了信息检索的效率。基于知识图谱的问答系统,是一种允许用户在存放着海量结构化知识的图谱上能快速获取正确答案的智能系统。本文针对旅游领域,以广西为例,给出了一种将传统的FAQ(Frequently Asked Questions)问答模型和本文提出的基于BiLSTM-CRF(Bi-directional Long Short-Term Memory-Conditional Random Field)的细粒度知识图谱问答模型相结合的问答系统。本文的主要研究工作如下:(1)鉴于单个网站上收纳的景点数据存在不全面的情况,本文运用Python中的Scrapy爬虫框架分别从携程网、去哪儿网和途牛网上爬取广西旅游景点数据,并对多源数据进行整合处理后倒入Neo4j图数据库,构建出了广西旅游景区知识图谱。(2)针对基于知识图谱的问答通常在候选主实体的筛选上步骤繁琐,且大多数模型忽略了问句与关系细粒度相关性的问题,给出了基于BiLSTM-CRF的细粒度知识问答模型,用于候选主实体和候选关系的选择。该模型,在实体识别部分,用BiLSTM-CRF模型来提高实体识别准确率,并将N-Gram模型与莱温斯坦距离(Levenshtein Distance)相结合用于候选主实体的筛选;在关系预测部分,分别应用注意力机制和CNN(Convolutional Neural Networks)从语义层次和词层次来捕获问句与关系之间的相互联系。最后,以FreeBase中的FB2M和FB5M作为评估数据集,对预测实体关系对的准确率进行试验分析,结果表明本文的模型显著优于现有的针对单一关系的问答方法。(3)基于已经构建好的广西旅游景区知识图谱,本文对基于BiLSTM-CRF的细粒度知识图谱问答模型进行了实现。构建出的问答系统将传统的FAQ问答模型和基于知识图谱的问答模型相结合,可以较好地满足游客对信息检索的高要求。
引用
收藏
页数:65
共 19 条
[1]
论地理知识图谱 [J].
陆锋 ;
余丽 ;
仇培元 .
地球信息科学学报, 2017, (06) :723-734
[2]
知识图谱在金融行业的应用展望 [J].
姜渊 ;
黄桦 ;
赵奕 .
金融电子化, 2016, (09) :87
[3]
知识图谱技术综述 [J].
徐增林 ;
盛泳潘 ;
贺丽荣 ;
王雅芳 .
电子科技大学学报 , 2016, (04) :589-606
[4]
基于本体的航空领域问答系统 [J].
张克亮 ;
李伟刚 ;
王慧兰 .
中文信息学报, 2015, 29 (04) :192-198
[5]
基于图形数据库Neo4j的RDF数据存储研究 [J].
康杰华 ;
罗章璇 .
信息技术, 2015, (06) :115-117
[6]
知识图谱在农业信息服务中的应用进展 [J].
刘家玮 ;
刘波 ;
沈岳 .
软件, 2015, 36 (03) :26-30
[7]
问答系统研究综述 [J].
毛先领 ;
李晓明 .
计算机科学与探索, 2012, (03) :193-207
[8]
基于多特征融合的句子语义相似度计算 [J].
赵臻 ;
吴宁 ;
宋盼盼 .
计算机工程, 2012, 38 (01) :171-173
[9]
社区问答系统研究综述 [J].
张中峰 ;
李秋丹 .
计算机科学, 2010, 37 (11) :19-23+54
[10]
基于句法和语义信息的问句特征提取方法 [J].
许莉 ;
王大玲 ;
夏秀峰 .
计算机工程, 2010, 36 (21) :65-66+70