基于用户行为与页面分析的改进PageRank算法

被引:8
作者
王旭阳
任国盛
机构
[1] 兰州理工大学计算机与通信学院
关键词
权威因子; 时间因子; 主题漂移; 转移概率; PR值;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
在经典PageRank算法中,页面的转移概率平均分配到链出页面,由于新网页的链接较少,其PR值普遍较低。经典PageRank算法通过链接计算PR值,未考虑到网页的内容,存在主题漂移现象。针对上述问题,引入网页权威因子和时间因子,通过网页按关键字检索后被点击的次数进行统计,根据其在初始排序结果中的位置对网页的PR值进行迭代修正,返回一个新的排序结果并分析网页内容,采用改进的TD-IDF算法解决网页相关性,避免主题漂移现象。仿真实验结果表明,改进算法可以提高网页排名的质量,使相关度较高的网页通过人们的自主选择获得不同程度的加权,获得加权的网页在检索结果中的排名得到提升,从而提高用户需求网页的查准率。
引用
收藏
页码:164 / 168
页数:5
相关论文
共 14 条
[1]   基于用户反馈的PageRank改进算法 [J].
方树峰 .
计算技术与自动化, 2012, 31 (01) :89-92
[2]   PageRank算法的分析及其改进 [J].
王德广 ;
周志刚 ;
梁旭 .
计算机工程, 2010, 36 (22) :291-293
[3]   Google搜索引擎的数学模型及其应用 [J].
赵国 ;
宋建成 .
西南民族大学学报(自然科学版), 2010, 36 (03) :480-486
[4]   网络爬虫在Web信息搜索与数据挖掘中应用 [J].
杨定中 ;
赵刚 ;
王泰 .
计算机工程与设计, 2009, 30 (24) :5658-5662
[5]   搜索引擎PageRank算法的改进 [J].
杨劲松 ;
凌培亮 .
计算机工程, 2009, 35 (22) :35-37
[6]   一种抗击链接垃圾页面的PageRank改进算法 [J].
张付志 ;
石占伟 ;
郭学敏 .
信息安全与通信保密, 2009, (08) :77-79
[7]   PageRank算法的优化和改进 [J].
吴家麒 ;
谭永基 .
计算机工程与应用, 2009, 45 (16) :56-59
[8]   基于PageRank算法的权威值不均衡分配问题 [J].
田甜 ;
倪林 .
计算机工程, 2007, (18) :53-55
[9]   基于网页链接和内容分析的改进PageRank算法 [J].
钱功伟 ;
倪林 ;
曹荣 .
计算机工程与应用, 2007, (21) :160-164
[10]   具有时间反馈的PageRank改进算法附视频 [J].
戚华春 ;
黄德才 ;
郑月锋 .
浙江工业大学学报, 2005, (03) :272-275