伴随着Internet的快速发展,Web从Web1.0发展到Web2.0,甚至向Web3.0发展。其中Web2.0更能够体现用户之间的交互性,用户不仅可以浏览网上信息,也能发布自己的信息。因此Web上的信息资源越来越庞大,几乎成为全球的信息资源库。从而使用户在这浩瀚的资源中检索到自己想要的信息变得十分困难,目前互联网中以关键字的简单匹配作为检索机制,在查全率和查准率上是很难有所成就的。本文就是利用本体技术,将目前的旅游信息检索服务从关键词匹配层次提高到计算机可理解的语义层次,为用户提供更准确、智能的旅游信息服务。
首先,对本体技术进行了大量的研究,本体是概念化的明确的规范说明,可以构成相关领域词汇的基本术语和关系。通过对旅游领域内的专业术语或者标准词汇以及术语之间关系的分析,通过本体描述语言描述了旅游领域本体概念之间的层次关系。利用本体开发工具,构建旅游领域本体库。
其次,对检索扩展方法进行了研究,得出本体语义检索概念扩展算法,就是将用户输入的检索关键字,在本体的支持下,通过概念相似度计算得到相似度的大小,然后根据设定的阈值,把相似度的值高于阈值的概念添加到原始的检索关键字集合中,扩展为新的概念集。该方法在一定程度上改进了用户检索信息的不足。
再次,在Jena框架的支持下,建立了旅游领域本体推理规则,借助Jena推理引擎和Jena中支持的SPARQL查询技术对本体进行操作,实现对本体资源的检索工作,然后把检索到的结果返回给用户。
最后,根据以上技术的研究,设计出了旅游黄页语义检索系统。并与传统旅游网站检索的返回结果进行了对比,实验证明了本文设计的检索系统有效的提高了查全率、查准率,并且在智能性方面都优于传统旅游网站的检索方法。