PageRank算法的改进

被引:19
作者
张丽
机构
[1] 北京交通大学理学院数学系
关键词
N-StepPageRank; 多看几步; 链接分析; 马尔可夫随机游走;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
080201 [机械制造及其自动化];
摘要
PageRank算法是目前被广泛应用的一种度量网页重要性的方法,它根据网页之间的链接结构来给每个网页打分。从数学的角度来解释,PageRank可以被看作是一个马尔可夫随机游走模型,依据网页下一步的链出信息计算网页的转移概率。受计算机象棋算法设计中一个很成功的策略:“多看几步”的启发,改进和推广了经典PageRank算法,提出了更为一般的N-stepPageRank算法,它在计算网页的转移概率时利用了网页N步的链接信息。经典PageRank算法是N-stepPageRank算法N=1时的特殊情形。TREC标准数据集上的试验表明,N-stepPageRank算法能够有效地提高网页搜索的精确度,MAP指标比经典的PageRank的提高超过15%。
引用
收藏
页码:673 / 677
页数:5
相关论文
共 1 条
[1]
Link analysis;eigenvectors;and stability..Ng AY;Zheng AX;Jordan MI;.Proc17th International Joint Conference on Artificial Intelligence.2001,