目前人们越来越依赖于图书检索技术从海量的图书资源中获取图书信息。图书检索也成为了当前信息检索中一个比较活跃的课题,它广泛地应用在数字图书馆、网上购书网站等系统中。然而目前几乎所有的图书检索系统都采用基于关键字的检索方法,其核心是关键字符的机械匹配,召回率和准确率都比较低,导致检索系统的整体性能并不理想。因此,我们开展了基于概念图的图书检索模型的研究。这种检索模型将图书信息和用户需求标引为概念图,通过概念图的匹配运算寻找用户所需的高质量检索结果,能够有效地弥补关键词检索存在的语义缺失。
本文的研究工作是基于概念图的图书检索模型研究的一部分。本文针对图书摘要的概念图标引进行了深入研究,希望解决基于概念图的图书检索模型中图书信息的概念图标引问题。本文的主要研究工作如下:
(1)定义了图书摘要的概念图标引形式。
本文首先为图书摘要的概念图标引建立了一个规范的关系类型集合,然后对概念图中的概念结点进行了扩展,使得图书摘要的概念图标引形式更有利于概念图的自动标引。
(2)提出了一种图书摘要的概念图自动标引方法。
本文利用领域文本的句法和语义知识,将浅层句法分析和分层次的句法语义分析结合起来实现了图书摘要概念图的自动标引。其中浅层句法分析识别出句子中的基本名词短语,并标注出基本名词短语的语义类别;分层次的句法语义分析利用预先建立的句法语义模板库,首先对句子分别进行主干分析,标引出句子的顶层概念图,然后对句子主干分析划分出的组块分别进行非主干分析,标引出组块的概念图,从而得到句子的完整概念图。
(3)对本文提出的图书摘要的概念图自动标引方法进行了实验,本方法概念图标引的正确率为66.1%,概念图标引的正确系数为76.7%,是一种有效的图书摘要的概念图自动标引方法。