基于Hash算法实现搜索引擎中重复WEB页面的消除

被引：6

作者：

杨海东

叶小岭

张颖超

机构：

[1] 南京信息工程大学信息与通信系

来源：

微计算机信息 | 2006年 / 27期

关键词：

网络蜘蛛; 搜索引擎; 散列函数; WEB;

D O I：

暂无

中图分类号：

TP391.3 [检索机];

学科分类号：

081203 ; 0835 ;

摘要：

搜索引擎已经成为互联网用户进入网络的一个重要入口。但目前搜索引擎的结果还存在着许多有待改进的地方。本文从搜索引擎返回结果中存在的重复页面入手,解决如何消除重复页面,并对其将来的发展进行了进一步探讨。

引用

页码：299 / 301

页数：3

共 7 条

[1] 基于时空混沌系统的单向Hash函数构造 [J].

张瀚 ;

王秀峰 ;

李朝晖 ;

刘大海 .

物理学报, 2005, (09) :4006-4011

[2] 用于互联网信息搜索系统的网络蜘蛛设计与实现 [J].

陈灶芳 ;

黄国涛 .

广东科技, 2005, (01) :48-49

[3] 用有向图法解决网页爬行中循环链接问题 [J].

赫枫龄 ;

左万利 .

吉林大学学报(理学版), 2004, (03) :402-404

[4] 一种基于ELGamal签名和零知识证明的身份认证方案 [J].

周先存 ;

侯整风 .

微计算机信息, 2004, (05) :114-16

[5] 两种对URL的散列效果很好的函数 [J].

李晓明 ;

凤旺森 .

软件学报, 2004, (02) :179-184

[6] 万维网的链接结构分析及其应用综述 [J].

王晓宇 ;

周傲英 .

软件学报, 2003, (10) :1768-1780

[7] 关于中国Web的大小、形状和结构 [J].

闫宏飞 ;

李晓明 .

计算机研究与发展, 2002, (08) :958-967

← 1 →