基于两级修正的页面排序改进算法

被引:1
作者
刘恩海 [1 ]
张梅芳 [1 ]
李天义 [1 ,2 ]
梁慧 [3 ]
穆立 [4 ]
机构
[1] 河北工业大学计算机科学与软件学院
[2] 部队
[3] 空军预警学院黄陂士官学校训练部
[4] 空军部队电子教研室
关键词
两级修正; PageRank; 相似度; 点击量趋势; 权威性; 时间维; 用户兴趣;
D O I
10.16208/j.issn1000-7024.2014.06.027
中图分类号
TP393.092 []; TP391.1 [文字信息处理];
学科分类号
080402 ; 081203 ; 0835 ;
摘要
经典的PageRank算法主要根据网页间链接结构进行分析排序,容易产生主题漂移、偏重旧网页、平均分配网页权值、忽视用户兴趣等问题。为了改进上述缺陷,提出一种基于两级修正的页面排序改进算法。综合利用网页相似度、点击量趋势、站内外链接、时间因子对网页的排序值进行一级修正;在此基础上结合用户兴趣对查询结果的排序值进行二级修正,使网页重要性权值计算更为合理;组织毕业生、在校生、教师3组人群进行实验调查,实验结果表明,与传统Page-Rank算法相比较,改进后算法的排序结果查准率更高,更满足用户的需求。
引用
收藏
页码:2024 / 2028
页数:5
相关论文
共 12 条
[1]   基于网站影响力的网页排序算法 [J].
张芳 ;
郭常盈 .
计算机应用, 2012, 32 (06) :1666-1669
[2]   融合反馈信息与内容相关度的PageRank改进算法 [J].
郭庆宝 ;
贾代平 .
计算机工程与设计, 2011, 32 (12) :4071-4074
[3]   一种基于用户角色的综合网页排序算法 [J].
龙文明 ;
彭敦陆 ;
姜兴龙 .
计算机工程, 2011, 37 (07) :53-55
[4]   Nutch中PageRank的并行实现 [J].
梁正友 ;
潘涛 .
计算机工程与设计, 2010, 31 (20) :4354-4356+4409
[5]   改进的非平均传递权值PageRank算法 [J].
王春花 ;
朱俊平 .
计算机工程与设计, 2010, 31 (10) :2231-2233+2237
[6]   利用蚁群算法对PageRank算法的改进 [J].
丁岳伟 ;
郭辉 .
计算机应用, 2009, 29 (10) :2726-2728+2740
[7]   基于时间链接分析的页面排序优化算法 [J].
鞠时光 ;
吕霞 ;
王崝 .
计算机应用研究, 2009, 26 (07) :2438-2441+2477
[8]   一种基于PageRank的页面排序改进算法 [J].
王冬 ;
雷景生 .
微电子学与计算机, 2009, 26 (04) :210-213
[9]  
基于网页兴趣度的用户兴趣模型体系研究.[D].南智敏.复旦大学.2012, 03
[10]   A hybrid approach for extracting informative content from web pages [J].
Uzun, Erdinc ;
Agun, Hayri Volkan ;
Yerlikaya, Tarik .
INFORMATION PROCESSING & MANAGEMENT, 2013, 49 (04) :928-944