大规模搜索引擎检索系统框架与实现要点

被引:19
作者
彭波
机构
[1] 北京大学计算机科学技术系
关键词
搜索引擎; 信息检索; 天网;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
随着Web规模的不断扩大,搜索引擎正成为因特网上最常用的应用之一。本文以天网搜索为实例,分析了大规模通用型中文搜索引擎检索系统的设计与实现技术。围绕检索效率和检索效果两个方面,本文介绍天网检索系统的集成框架结构和分布式架构,并分析了索引创建和索引检索中的相关实现技术。
引用
收藏
页码:1 / 4
页数:4
相关论文
共 6 条
[1]  
Improved relevance ranking in WebGather.[J].Ming Lei;Jianyong Wang;Baojue Chen;Xiaoming Li.Journal of Computer Science and Technology.2001, 5
[2]   Adding compression to block addressing inverted indexes [J].
Navarro, G ;
De Moura, ES ;
Neubert, M ;
Ziviani, N ;
BaezaYates, R .
INFORMATION RETRIEVAL, 2000, 3 (01) :49-77
[3]  
Query processing and inverted indices in shared-nothing text document information retrieval systems.[J].Anthony Tomasic;Hector Garcia-Molina.The VLDB Journal.1993, 3
[4]   一种中文网页自动分类方法的实现及应用 [J].
冯是聪 ;
张志刚 ;
李晓明 .
计算机工程, 2004, (05) :19-20+108
[5]   海量Web搜索引擎系统中用户行为的分布特征及其启示 [J].
王建勇 ;
单松巍 ;
雷鸣 ;
谢正茂 ;
李晓明 .
中国科学E辑:技术科学, 2001, (04) :372-384
[6]  
中文文本自动分词和标注.[M].刘开瑛著;.商务印书馆.2000,