一种基于社会性标注的网页排序算法

被引:19
作者
刘凯鹏 [1 ]
方滨兴 [1 ,2 ]
机构
[1] 哈尔滨工业大学计算机网络与信息安全技术研究中心
[2] 不详
关键词
社会性标注; 网页检索; 网页质量; 排序算法; 主题模型;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
社会性标注作为一种新的资源管理和共享方式,吸引为数众多的用户参与其中,由此产生的大量社会性标注数据成为网页质量评价的一个新维度.文中研究如何利用社会性标注改进网页检索性能,提出一种有机结合网页和用户的查询相关性与互增强关系的网页排序算法.首先利用统计主题模型,使用相关标签为网页和用户建模,并计算查询相关性.然后利用二部图模型刻画网页和用户间的互增强关系,并使用相关标签与用户兴趣和网页内容的匹配度为互增强关系赋予权重.最后结合查询相关性和互增强关系,以迭代方式同时计算网页和用户的评分.实验结果表明,文中提出的检索模型和互增强模型能够有效地提高排序算法的性能.与目前的代表性算法相比,该算法在检索性能上有明显提高.
引用
收藏
页码:1014 / 1023
页数:10
相关论文
共 3 条
  • [1] Combating spam in tagging systems[J] . Georgia Koutrika,Frans Adjie Effendi,Zolt′n Gy?ngyi,Paul Heymann,Hector Garcia-Molina.ACM Transactions on the Web (TWEB) . 2008 (4)
  • [2] Authoritative sources in a hyperlinked environment
    Kleinberg, JM
    [J]. JOURNAL OF THE ACM, 1999, 46 (05) : 604 - 632
  • [3] Measures for the comparison of information retrieval systems. Polalck,S. Am. Doc . 1968