共 7 条
基于Hash算法实现搜索引擎中重复WEB页面的消除
被引:6
作者:
杨海东
叶小岭
张颖超
机构:
[1] 南京信息工程大学信息与通信系
来源:
关键词:
网络蜘蛛;
搜索引擎;
散列函数;
WEB;
D O I:
暂无
中图分类号:
TP391.3 [检索机];
学科分类号:
081203 ;
0835 ;
摘要:
搜索引擎已经成为互联网用户进入网络的一个重要入口。但目前搜索引擎的结果还存在着许多有待改进的地方。本文从搜索引擎返回结果中存在的重复页面入手,解决如何消除重复页面,并对其将来的发展进行了进一步探讨。
引用
收藏
页码:299 / 301
页数:3
相关论文