基于本体的企业文本检索模型研究

被引:0
作者
张申恒
机构
[1] 合肥工业大学
关键词
文本检索; 本体描述符; 领域本体; 语义相似度; 文档聚类;
D O I
暂无
年度学位
2005
学位类型
硕士
导师
摘要
企业中的文本随着企业的不断发展而呈现爆炸式的增长,如何在海量数据中检索需要的文本是企业知识管理中的一个重要的研究课题;而本体提供对某个领域知识的共同理解,提供基于语义的知识获取和共享,因此可以借助于本体,通过定义和共享共同的领域知识来促进用户和信息服务器对领域知识的共同理解,提高知识检索的层次,以提高文本检索的查准率和查全率。 本文首先研究分析了本体的概念、分类、功能、描述语言、理论和应用研究现状,并把目前的文本信息检索技术分成了四个流派,综合分析比较了目前文本信息检索技术的原理、优缺点;然后具体研究分析了目前基于本体的信息检索方法研究的现状,针对其不足之处提出了一个基于本体的企业文本检索模型。在这个模型中,本文提出了以文本自然段作为检索对象,通过信息抽取以本体描述符来表示文本自然段和检索要求,重点研究了领域本体建设方法、本体描述符相似度的计算、文档模糊聚类分析,并在其后给出了相似度和模糊聚类分析的计算实例。
引用
收藏
页数:71
共 10 条
[1]
一个基于本体论全文自动标引方案 [J].
王泰森 .
情报科学, 2003, (09) :950-952
[2]
基于Ontology的文本信息抽取 [J].
陆科进 ;
李新颖 .
计算机应用研究, 2003, (07) :46-48
[3]
基于本体的语义信息查询系统的研究与实现 [J].
徐振宁 ;
宋阔益 ;
张维明 ;
李勇 ;
李由 .
计算机工程, 2002, (12) :6-8
[4]
Ontology研究综述 [J].
邓志鸿 ;
唐世渭 ;
张铭 ;
杨冬青 ;
陈捷 .
北京大学学报(自然科学版), 2002, (05) :730-738
[5]
基于本体论和多主体的信息检索服务器 [J].
武成岗 ;
焦文品 ;
田启家 ;
史忠植 .
计算机研究与发展, 2001, (06) :641-647
[6]
本体论与信息检索 [J].
廖明宏 .
计算机工程, 2000, (02) :56-58
[7]
文本信息检索技术 [J].
邹涛 ;
王继成 ;
杨文清 ;
张福炎 .
计算机科学, 1999, (09) :72-75
[8]
汉语自动分词技术的现状及发展趋势 [J].
尹锋 ;
林亚平 .
软件世界, 1996, (12) :80-84
[9]
ScholOnto: An ontology-based digital library server for research documents and discourse [J].
Shum S.B. ;
Motta E. ;
Domingue J. .
International Journal on Digital Libraries, 2000, 3 (3) :237-248
[10]
The Lorel query language for semistructured data [J].
Serge Abiteboul ;
Dallan Quass ;
Jason McHugh ;
Jennifer Widom ;
Janet L. Wiener .
International Journal on Digital Libraries, 1997, 1 (1) :68-88