基于时间链接分析的页面排序优化算法

被引:6
作者
鞠时光
吕霞
王崝
机构
[1] 江苏大学计算机科学与通信工程学院
关键词
页面排序算法; 网页; 网络挖掘;
D O I
暂无
中图分类号
TP393.01 [];
学科分类号
081201 ; 1201 ;
摘要
传统的页面排序算法偏重于旧网页,使得一些旧的页面经常出现在检索结果的前面。为了改进此类算法,引入时间链接分析,使用爬虫抓起页面时HTTP协议反馈回来的修改时间作为页面和链接的时间,并综合考虑页面的出入链接个数和时间来计算页面的权重值。开发出的WTPR算法能使新网页集在排序中上升,高质量的旧网页比普通的旧网页能获得较高的排序值。
引用
收藏
页码:2438 / 2441+2477 +2477
页数:5
相关论文
共 3 条
[1]   PageRank算法研究 [J].
黄德才 ;
戚华春 .
计算机工程, 2006, (04) :145-146+162
[2]   加速评估算法:一种提高Web结构挖掘质量的新方法 [J].
张岭 ;
马范援 ;
不详 .
计算机研究与发展 , 2004, (01) :98-103
[3]  
The link database:fast access to graphs of the Web .2 RANDALL K,STATA R,WICKREMESINGHE R,et al. SRC Research Report175 . 2001