一种高效的全文检索索引技术

被引:7
作者
陈玮
陈玉鹏
石晶
陆达
机构
[1] 清华大学光盘国家工程研究中心
[2] 清华大学光盘国家工程研究中心 北京
[3] 北京
关键词
全文检索; 词索引; 内存缓存; 索引压缩;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
针对目前比较流行的基于词的倒排文档索引模型 ,结合全文检索数据的特点 ,提出了变长编码的索引压缩算法。利用该压缩编码 ,研究了基于内存缓存的快速创建索引的流程。通过实验 ,对索引膨胀率、创建时间和检索响应速度进行了对比分析 ,表明该技术提高了索引的空间与时间效率
引用
收藏
页码:35 / 37+40 +40
页数:4
相关论文
共 2 条
[1]   Adding compression to block addressing inverted indexes [J].
Navarro, G ;
De Moura, ES ;
Neubert, M ;
Ziviani, N ;
BaezaYates, R .
INFORMATION RETRIEVAL, 2000, 3 (01) :49-77
[2]  
基于数据压缩的信息检索技术的研究.[D].赵鹏.黑龙江大学.2002, 01