面向旅游服务的智能标注及知识图谱构建系统

被引:0
作者
曹明辉
机构
[1] 北京邮电大学
关键词
知识图谱; 旅游数据集; 智能问答; 智能标注;
D O I
10.26969/d.cnki.gbydu.2020.001079
年度学位
2020
学位类型
硕士
导师
摘要
随着互联网技术的不断更新和进步,网络信息也在呈指数迅猛增长,如何从海量的网络数据中提取出有价值的信息,并有效地利用起来,受到了人工智能领域的研究者们热切关注,近年来层出不穷的海量数据处理及存储技术相继被提出,其中最为引人瞩目的莫过于知识图谱。知识图谱目前已经在智能问答系统和智能推荐等应用中得到广泛的使用。然而,旅游领域的知识图谱却十分缺少,使得旅游信息不能够得到很有效地利用,这无疑减缓了智慧旅游的发展。针对目前互联网旅游数据量巨大,但并没有得到高效利用的现状,本文以海南地区为例,主要基于旅游游记,从旅游游记中提取出和旅游有关的知识内容,构建一个在现实生活中可供人们使用的旅游知识图谱。首先,基于Scrapy框架构建爬虫系统,从目前主流的旅游网站获取关于海南地区的旅游游记信息。通过对游记数据进行清洗等预处理工作后,进行词频统计分析,挖掘出人们在旅游中切实关注的内容主题,根据分析结果,定义旅游实体及实体关系,构建命名实体识别和关系抽取数据集,用于深度学习模型训练,以便后续对非结构化的游记数据进行旅游实体抽取和关系抽取。其次,使用Protege本体编辑工具进行旅游本体编辑,对获取到的三元组知识进行编辑,接着使用Neo4j数据库,对模式层的本体和数据层的三元组进行存储,再采用实体链接技术对数据进行实体对齐,最后对知识图谱周期性更新的方法进行介绍和探讨,从而实现一个完整的知识图谱构建系统。在构建实体识别和关系抽取数据集时,发现现有标注工具仍然需要大量的人工操作,这无疑令标注数据变得低效,故本论文设计了智能标注系统,快速实现数据标注,减少人工标注成本。最后,为了对构建的旅游知识图谱进行应用,以便用户从中获取需要的信息,本论文特设计了基于知识库的智能问答系统,知识库问答系统主要采用深度学习技术实现知识问答,并设计智能旅游问答助手,以微信公众号的方式呈现给用户,用户可以直接使用自然语言进行提问,问答系统通过对问句进行处理,最后返回相应的答案给用户。
引用
收藏
页数:83
共 23 条
[1]
内蒙古自治区旅游领域知识库构建及应用研究 [D]. 
韩凌洁 .
内蒙古大学,
2019
[2]
旅游领域知识图谱的构建及应用研究 [D]. 
刘济源 .
浙江大学,
2019
[3]
基于孪生循环神经网络的实体对齐算法研究 [D]. 
吕旸 .
南京大学,
2018
[4]
实体和属性对齐方法的研究与实现 [D]. 
杨秀璋 .
北京理工大学,
2016
[5]
旅游目的地本体构建研究 [D]. 
王双凤 .
湘潭大学,
2016
[6]
旅游领域本体构建研究 [D]. 
李庆赛 .
郑州大学,
2015
[7]
精通Scrapy网络爬虫.[M].刘硕.清华大学出版社.2017,
[8]
Django开发宝典.[M].王友钊;黄静.清华大学出版社.2016,
[9]
RoBERTa: A Robustly Optimized BERT Pretraining Approach..[J].Yinhan Liu;Myle Ott;Naman Goyal;Jingfei Du;Mandar Joshi;Danqi Chen;Omer Levy;Mike Lewis;Luke Zettlemoyer;Veselin Stoyanov.CoRR.2019,
[10]
ALBERT: A Lite BERT for Self-supervised Learning of Language Representations..[J].Zhenzhong Lan;Mingda Chen;Sebastian Goodman;Kevin Gimpel;Piyush Sharma;Radu Soricut.CoRR.2019,