面向旅游的蒙汉双语知识图谱的研究与构建

被引:0
作者
耿雪来
机构
[1] 内蒙古大学
关键词
旅游资源; 知识提取; 知识图谱; 蒙汉双语; 命名实体识别; 卷积神经网络;
D O I
暂无
年度学位
2019
学位类型
硕士
导师
摘要
在交通和互联网的高速发展的今天,旅游业成为当今国民收入的重要部分,“旅游+互联网”模式应运而生。旅游资源的信息变得越来越庞大,越来越杂,虽然人们可以很容易在网上搜索到一些资源,但是也存在越来越多的无用信息,它们极大地干扰了民众对有用信息的检索,所以,如何利用好复杂庞大的信息,并从中有效地提取到有用信息变得非常紧迫。针对以上问题,本文构建了面向旅游的蒙汉双语知识图谱。构建过程主要包括以下四部分:首先,构建旅游领域语义框架,根据语义框架对信息进行抽取和处理。本文的数据来源主要有互动百科,百度百科,搜狗百科,以及携程等各个旅游网站。其次,进行数据预处理,并建立语料库。利用开源工具NeuralCoref,把文本中的指代词替换成实体名称,以便于更好的分词和标注。分词操作利用NLPIR工具完成,标注方式采用BMEO,在这个阶段完成语料库的建立。然后,对于标注好的文本,使用CRFs工具包完成命名实体识别,并且采用卷积神经网络来完成关系抽取。根据抽取的实体及属性关系,形成构建知识图谱的三元组。把其中抽取到的属性值进行融合,选择最优的属性值。通过查询专业书籍和利用专业蒙古文处理平台对三元组进行蒙文处理。最后,依据七步法的构建过程,利用Protégé工具完成旅游领域本体的构建,进而在领域本体的基础上,实现了面向旅游的蒙汉双语知识图谱的构建。
引用
收藏
页数:55
共 34 条
[1]
基于知识图谱的领域知识库管理系统的设计与实现.[D].化立志.北京邮电大学.2018, 10
[2]
基于大数据的企业图谱的研究与应用 [D]. 
袁安云 .
华南理工大学,
2017
[3]
基于深度卷积神经网络的实体关系抽取 [D]. 
王林玉 .
太原理工大学,
2017
[4]
特定领域实体属性关系抽取方法研究 [D]. 
尚琪 .
昆明理工大学,
2017
[5]
命名实体消歧的研究与实现.[D].杨晓.北京邮电大学.2017, 03
[6]
基于领域本体的蒙古文语义检索研究 [D]. 
石宇 .
内蒙古大学,
2016
[7]
旅游领域知识图谱构建方法的研究和实现 [D]. 
徐溥 .
北京理工大学,
2016
[8]
基于词向量和深度卷积神经网络的领域实体关系抽取 [D]. 
邵发 .
昆明理工大学,
2016
[9]
基于领域本体的个性化旅游推荐系统的研究与实现 [D]. 
张猛 .
重庆大学,
2015
[10]
领域实体属性关系抽取方法研究 [D]. 
刘丽佳 .
昆明理工大学,
2015