Web的飞速发展已经使它成为世界上最大的一个信息库,但是“信息过载”问题又降低了它的可用性。当人们依赖于搜索引擎和信息检索技术来寻找信息的时候,却发现目前的关键词搜索方法在很多情况下并不能很好地满足他们的信息需求。究其原因是因为仅仅使用关键词并没有明确地表达出用户查询的语义,即便是使用查询扩展和词义消歧的技术也不能完全解决这个问题。于是,对“语义搜索”的要求便应运而生。
由于其跨领域的特性,语义搜索至今还没有一个公认的定义。不过,自然语言处理、文本挖掘、知识表示及推理等方面工作的大幅进展,以及语义网的兴起,已经大大推动了“语义搜索”的相关研究。本文所要解决的语义搜索是一种基于明确的、形式化定义的语义信息而进行的匹配查询内容的搜索技术。针对本文所面向的问题域——匹配文本描述内容的资源搜索,并且在比较了各种语义搜索常用的知识表示语言的特点之后,我们最终选取了概念图来作为我们方法中的语义表示。它是一种具有一阶谓词逻辑的完整表达能力的图形化表示,因而可以把语义匹配归约到图匹配,而又不失逻辑的严密性。
本文的主要工作和贡献(创新点)可以概括为以下几个方面:
1.提出了一种限制到概念图的一个子集上的知识表示,以达到可以在语义匹配时把概念图展开成树的形式的目的,但同时又保留了相对本文的问题域而言是足够的表达能力。我们根据资源搜索的领域特征,为每张概念图指定一个入口概念,并且对互指链接、支配概念等方面都做了严谨的约束。该设计的结果是在概念图中保留了对否定描述的表达能力,故而基本可以满足所有与资源搜索相关的概念图表示;同时又为之后降低图匹配的计算复杂度打下了基础。