内蒙古自治区旅游领域知识库构建及应用研究

被引:0
作者
韩凌洁
机构
[1] 内蒙古大学
关键词
知识库; 本体; Protégé; Neo4j; 知识库问答;
D O I
暂无
年度学位
2019
学位类型
硕士
导师
摘要
互联网技术不断推陈出新,信息同时也在成指数级爆炸增长,搜索引擎逐渐代替传统书本,成为人们快速获取知识的重要来源。对海量的互联网数据进行规范化,并挖掘利用其有效的信息,是人工智能领域发展的重要研究课题。自2012年谷歌提出了知识图谱的概念,并成功应用在搜索引擎中,知识图谱即知识库成为一项建立并规范一定规模知识资源的技术。之后,业界将关注焦点聚集在如何研究构建具体领域的垂直知识图谱,其中,进展较快的项目多为金融领域,旅游领域涉及较少,而学术界和工业界也没有公开的内蒙古旅游领域知识图谱的成果。本文旨在整合内蒙古自治区旅游领域的景点信息,建立多源数据的领域本体知识库。首先,设计爬虫类工具,从百科类和旅游类网站获取关于内蒙古自治区A级景点的信息。经过知识清洗等预处理工作后,形成<实体,属性,属性值>和<实体1,关系,实体2>形式的三元组知识。其次,将获取的三元组通过Protégé本体编辑工具,自顶向下地规范模式层的概念,降低与数据层对接的成本。最后,使用图数据库Neo4j,存储模式层的本体和数据层的三元组知识,完成知识库的构建。现有搜索引擎对于用户的提问,返回的结果多为基于文档的排序结果,忽略了自然语言的语义关系,结果准确性较差且不具备智能性。为了应用已构建的旅游知识库,本文实现了问答功能并设计了具有用户交互界面的问答系统。知识库问答采用基于模板匹配的方法,其处理流程为用户以自然语言的方式提问,系统经过问句分类、问句解析和返回答案三个步骤,给用户返回结果。
引用
收藏
页数:57
共 31 条
[1]
关于术语ontology的中文译名—“本体论”与“知识本体”.[A].冯志伟;.第六届汉语词汇语义学研讨会.2005,
[2]
DBpedia - A crystallization point for the Web of Data [J].
Bizer, Christian ;
Lehmann, Jens ;
Kobilarov, Georgi ;
Auer, Soeren ;
Becker, Christian ;
Cyganiak, Richard ;
Hellmann, Sebastian .
JOURNAL OF WEB SEMANTICS, 2009, 7 (03) :154-165
[3]
Frameworks for entity matching: A comparison.[J]..Data & Knowledge Engineering.2009, 2
[4]
Knowledge engineering: Principles and methods.[J].Rudi Studer;V.Richard Benjamins;Dieter Fensel.Data & Knowledge Engineering.1998, 1
[5]
WordNet.[J].George A. Miller.Communications of the ACM.1995, 11
[6]
Neo4j 权威指南.[M].张帜.清华大学出版社.2017,
[7]
人工智能及其应用.[M].王万良.高等教育出版社.2015,
[8]
基于地理本体的吉林地域知识图谱的构建 [D]. 
刘鎏 .
北京交通大学,
2017
[9]
古建筑领域本体的构建及应用研究 [D]. 
徐月洁 .
广西师范大学,
2017
[10]
基于领域本体的蒙医药学知识库构建与知识发现研究 [D]. 
鲍玉来 .
吉林大学,
2018