高性能网页索引器JUIndexer的实现

被引:4
作者
赫枫龄 [1 ]
左万利 [2 ]
张雪松 [1 ]
机构
[1] 吉林大学计算机科学与技术学院
[2] 吉林大学符号计算与知识工程教育部重点实验室
关键词
Web网页; 网络搜索引擎; 网页索引器;
D O I
10.13413/j.cnki.jdxblxb.2006.01.009
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
高性能网页索引器JUIndexer用倒排索引表存储网页索引数据,以多线程并行的方式对网页建立索引数据,采用经过优化的检索算法实现用户的查询.首先给出了JUIndexer的系统框架,然后描述了索引数据在JUIndexer中的存储结构、建立网页索引的算法、以及实现用户查询的检索算法.实验结果表明,JUIndexer能在毫秒级的时间内完成用户的查询,它采用的经过优化的词组检索算法缩短了词组的检索时间.
引用
收藏
页码:50 / 56
页数:7
相关论文
共 2 条
[1]   一种基于后缀数组的无词典分词方法 [J].
张长利 ;
赫枫龄 ;
左万利 .
吉林大学学报(理学版), 2004, (04) :548-553
[2]   新一代网络搜索引擎系统CHINAVIVI的实现 [J].
赫枫龄 ;
陶文学 ;
李凯 ;
周力 ;
左万利 .
吉林大学学报(理学版), 2003, (02) :192-195