中文Web文档全文检索系统的设计及实现

被引:13
作者
曹元大
贺海军
涂哲明
机构
[1] 北京理工大学计算机科学与工程系
关键词
全文检索; Web文档; 字索引; 压缩算法;
D O I
10.15918/j.tbit1001-0645.2002.01.017
中图分类号
TP393 [计算机网络];
学科分类号
081201 ; 1201 ;
摘要
为解决在检索某些词时发生漏检或错检 ,以及查全率和查准率不高的问题 ,研究字索引技术在中文 Web文档检索中的应用 .着重讨论字索引组织结构和检索方法 ,并引入了字节对齐的索引压缩方法 ,最后描述了一个中文 Web文档全文检索系统的结构和实现 .测试表明 ,该系统在响应时间和查准率方面性能均比较好 ,具有一定的实用性
引用
收藏
页码:68 / 71
页数:4
相关论文
共 2 条
[1]   基于Web中文检索系统SEARCH2000的设计与实现 [J].
杜林 ;
张毅波 ;
孙玉芳 .
中文信息学报, 2000, (06) :14-20
[2]   中文Web文档库全文检索技术研究与实现 [J].
杨文清 ;
黄宜华 ;
张福炎 .
中文信息学报, 1999, (04) :50-57