基于MapReduce的微博用户搜索排名算法

被引:12
作者
梁秋实
吴一雷
封磊
机构
[1] 北京市科学技术研究院北京市计算中心
关键词
微博搜索; 云计算; MapReduce编程模型; Hadoop平台/系统; PageRank算法;
D O I
暂无
中图分类号
TP391.3 [检索机]; TP393.09 [];
学科分类号
081203 ; 0835 ; 080402 ;
摘要
在微博搜索领域,单纯依赖于粉丝数量的搜索排名使刷粉行为有了可乘之机,通过将用户看作网页,将用户间的"关注"关系看作网页间的链接关系,使PageRank关于网页等级的基本思想融入到微博用户搜索,并引入一个状态转移矩阵和一个自动迭代的MapReduce工作流将计算过程并行化,进而提出一种基于MapReduce的微博用户搜索排名算法。在Hadoop平台上对该算法进行了实验分析,结果表明,该算法避免了用户排名单纯与其粉丝数量相关,使那些更具"重要性"的用户在搜索结果中的排名获得提升,提高了搜索结果的相关性和质量。
引用
收藏
页码:2989 / 2993
页数:5
相关论文
共 2 条
[1]   基于消息传递机制的MapReduce图算法研究 [J].
潘巍 ;
李战怀 ;
伍赛 ;
陈群 .
计算机学报, 2011, 34 (10) :1768-1784
[2]  
OpenMP:an industry standard API for sh ared-memory programming .2 Leonardo Draum,Ramesh Menon. Computational Science & Engineering . 1998