PageRank算法应用在文献检索排序中的研究及改进

被引:14
作者
汪志伟
邹艳妮
吴舒霞
机构
[1] 南昌大学信息工程学院
关键词
文献检索; 多维检索排序; PageRank算法; 文献活跃度;
D O I
10.16353/j.cnki.1000-7490.2016.11.024
中图分类号
TP391.3 [检索机];
学科分类号
摘要
传统文献检索大多按照被引次数、发表时间、搜索词出现频次等条件之一对结果进行排序,角度单一且忽略了文献相互引用带来的价值流动,往往会出现部分文献排名过高或过低的现象。为此,很多国内外学者提出将PageRank算法应用到文献检索中,并取得了一定程度的改进,但是忽略了一些特殊情况,如文献使用价值可能会随时间的推移而产生衰退,还有一些发表时间较短的文献被引次数为零,如何去评估它的价值等。文章针对这些问题,提出了一种多维检索排序法,综合考虑各种因素带来的影响,并引入文献活跃度的概念,以加权的方式将文献价值量化。实验证明,多维检索排序法比传统文献检索排序法效果更好,而且由权值迭代所带来的额外的计算量均为离线完成,在提高准确率的同时也很好地保持了检索的效率。
引用
收藏
页码:126 / 130+144 +144
页数:6
相关论文
共 10 条
[1]   基于CNKI的图书、情报学与档案学学科文献半衰期分析 [J].
刘伙玉 .
图书与情报, 2015, (01) :106-111
[2]   求解PageRank问题的多步幂法修正的内外迭代法 [J].
顾传青 ;
马先磊 .
应用数学与计算数学学报, 2014, 28 (04) :454-460
[3]   基于MapReduce的并行PageRank算法实现 [J].
平宇 ;
向阳 ;
张波 ;
黄寅飞 .
计算机工程, 2014, 40 (02) :31-34+38
[4]   基于学科引文的文献生命周期模型探析 [J].
王素丽 .
情报理论与实践, 2012, 35 (03) :37-41
[5]   基于PageRank的引文分析方法探讨 [J].
李长玲 ;
翟雪梅 .
情报理论与实践, 2007, (01) :122-124
[6]   PageRank算法研究 [J].
黄德才 ;
戚华春 .
计算机工程, 2006, (04) :145-146+162
[7]  
链接分析对引文分析的启示:从PageRank到Paperank[J]. 李江,孙建军.情报学报. 2009 (04)
[8]  
基于阅读价值的科技文献排序方法研究[J]. 张光前,刘欣,冯永琴.情报学报. 2009 (06)
[9]  
文献检索系统排序指标研究与实践[J]. 王胜海,宋丽哲,于晓松,石子夜.数字图书馆论坛. 2007 (12)
[10]  
The anatomy of a large-scale hypertextual Web search engine[J] . Sergey Brin,Lawrence Page.Computer Networks and ISDN Systems . 1998 (1)