全文检索系统的数据预处理研究

被引:3
作者
韩升
刘广志
机构
[1] 北京交通大学软件学院
关键词
全文检索; 预处理; 文本标引; 索引数据库;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研发的核心。在一个全文检索系统中,全文索引数据库的建立是系统的基础,其设计结构直接影响到全文检索引擎的检索算法以及系统最终的检索效率。文中主要介绍全文检索系统中索引库结构设计、文本标引技术等数据预处理技术,以及全文检索系统索引数据库的数据处理流程。最后,在此基础上研究了全文检索系统索引库索引生成算法,给出了单个文档和批处理两种情况下的索引库索引生成算法。
引用
收藏
页码:208 / 210
页数:3
相关论文
共 4 条
[1]   一种高效的全文检索索引技术 [J].
陈玮 ;
陈玉鹏 ;
石晶 ;
陆达 .
计算机应用研究, 2004, (07) :35-37+40
[2]   一个中文全文检索系统的设计与实现 [J].
曾元鉴 ;
李孝明 .
计算机与数字工程, 2004, (03) :12-15
[3]   全文数据库建库原理与应用技术 [J].
王兰成 ;
蒋丹 ;
刘庆辉 .
情报学报, 1999, (04) :319-326
[4]  
中文全文检索技术的研究及实现[J]. 李梅,王庆林.情报学报. 2003 (01)