基于Hash算法实现搜索引擎中重复WEB页面的消除

被引:6
作者
杨海东
叶小岭
张颖超
机构
[1] 南京信息工程大学信息与通信系
关键词
网络蜘蛛; 搜索引擎; 散列函数; WEB;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
搜索引擎已经成为互联网用户进入网络的一个重要入口。但目前搜索引擎的结果还存在着许多有待改进的地方。本文从搜索引擎返回结果中存在的重复页面入手,解决如何消除重复页面,并对其将来的发展进行了进一步探讨。
引用
收藏
页码:299 / 301
页数:3
相关论文
共 7 条
[1]   基于时空混沌系统的单向Hash函数构造 [J].
张瀚 ;
王秀峰 ;
李朝晖 ;
刘大海 .
物理学报, 2005, (09) :4006-4011
[2]   用于互联网信息搜索系统的网络蜘蛛设计与实现 [J].
陈灶芳 ;
黄国涛 .
广东科技, 2005, (01) :48-49
[3]   用有向图法解决网页爬行中循环链接问题 [J].
赫枫龄 ;
左万利 .
吉林大学学报(理学版), 2004, (03) :402-404
[4]   一种基于ELGamal签名和零知识证明的身份认证方案 [J].
周先存 ;
侯整风 .
微计算机信息, 2004, (05) :114-16
[5]   两种对URL的散列效果很好的函数 [J].
李晓明 ;
凤旺森 .
软件学报, 2004, (02) :179-184
[6]   万维网的链接结构分析及其应用综述 [J].
王晓宇 ;
周傲英 .
软件学报, 2003, (10) :1768-1780
[7]   关于中国Web的大小、形状和结构 [J].
闫宏飞 ;
李晓明 .
计算机研究与发展, 2002, (08) :958-967