面向图书检索的图书摘要概念图标引研究

被引:0
作者
陈戈
机构
[1] 上海交通大学
关键词
图书检索; 概念图; 图书摘要; 概念图标引;
D O I
暂无
年度学位
2008
学位类型
硕士
导师
摘要
目前人们越来越依赖于图书检索技术从海量的图书资源中获取图书信息。图书检索也成为了当前信息检索中一个比较活跃的课题,它广泛地应用在数字图书馆、网上购书网站等系统中。然而目前几乎所有的图书检索系统都采用基于关键字的检索方法,其核心是关键字符的机械匹配,召回率和准确率都比较低,导致检索系统的整体性能并不理想。因此,我们开展了基于概念图的图书检索模型的研究。这种检索模型将图书信息和用户需求标引为概念图,通过概念图的匹配运算寻找用户所需的高质量检索结果,能够有效地弥补关键词检索存在的语义缺失。 本文的研究工作是基于概念图的图书检索模型研究的一部分。本文针对图书摘要的概念图标引进行了深入研究,希望解决基于概念图的图书检索模型中图书信息的概念图标引问题。本文的主要研究工作如下: (1)定义了图书摘要的概念图标引形式。 本文首先为图书摘要的概念图标引建立了一个规范的关系类型集合,然后对概念图中的概念结点进行了扩展,使得图书摘要的概念图标引形式更有利于概念图的自动标引。 (2)提出了一种图书摘要的概念图自动标引方法。 本文利用领域文本的句法和语义知识,将浅层句法分析和分层次的句法语义分析结合起来实现了图书摘要概念图的自动标引。其中浅层句法分析识别出句子中的基本名词短语,并标注出基本名词短语的语义类别;分层次的句法语义分析利用预先建立的句法语义模板库,首先对句子分别进行主干分析,标引出句子的顶层概念图,然后对句子主干分析划分出的组块分别进行非主干分析,标引出组块的概念图,从而得到句子的完整概念图。 (3)对本文提出的图书摘要的概念图自动标引方法进行了实验,本方法概念图标引的正确率为66.1%,概念图标引的正确系数为76.7%,是一种有效的图书摘要的概念图自动标引方法。
引用
收藏
页数:64
共 23 条
[1]
A content-search information retrieval process based on conceptual graphs [J].
Genest, D ;
Chein, M .
KNOWLEDGE AND INFORMATION SYSTEMS, 2005, 8 (03) :292-309
[2]
Learning translation templates from bilingual translation examples [J].
Cicekli, I ;
Güvenir, HA .
APPLIED INTELLIGENCE, 2001, 15 (01) :57-76
[3]
Knowledge engineering: Principles and methods.[J].Rudi Studer;V.Richard Benjamins;Dieter Fensel.Data & Knowledge Engineering.1998, 1
[5]
一种结合术语部件库的术语提取方法 [J].
何燕 ;
穗志方 ;
段慧明 ;
俞士汶 .
计算机工程与应用, 2006, (33) :4-7
[6]
面向特定领域的汉语句法主干分析 [J].
齐浩亮 ;
杨沐昀 ;
孟遥 ;
韩习武 ;
赵铁军 .
中文信息学报, 2004, (01) :1-5+13
[7]
信息科学与技术领域术语部件描述 [J].
吴云芳 ;
穗志方 ;
邱利坤 ;
宋作燕 ;
胡俊峰 .
语言文字应用, 2003, (04) :34-39
[8]
语义成分分析法综述 [J].
施兵 .
合肥工业大学学报(社会科学版), 2003, (04) :130-133
[9]
汉语基本短语的自动识别 [J].
张昱琪 ;
周强 .
中文信息学报, 2002, (06) :1-8
[10]
一种基于混合分析的汉语文本句法语义分析方法 [J].
尹凌 ;
姚天昉 ;
张冬茉 ;
李芳 .
中文信息学报, 2002, (04) :45-51