超链接导向搜索算法中主题漂移的研究

被引:5
作者
高琪
张永平
机构
[1] 中国矿业大学计算机科学与技术学院
关键词
主题漂移; 页面排序; 搜索引擎;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
超链接导向搜索(HITS)算法是比较经典的基于超链接的算法,但它忽视了链接页面的文本信息内容,没有区分链接的重要性,从而导致算法不可避免地发生主题漂移现象。为了解决这一问题,在原HITS算法的基础上,引入了经典的tf-idf算法,通过计算链接页面与查询主题的相关度来区分链接的重要性,以解决主题漂移的问题。改进算法使搜索引擎的排序结果更符合查询条件,相应的查确率也有很大提高。
引用
收藏
页码:3100 / 3102+3106 +3106
页数:4
相关论文
共 3 条
[1]   基于链接分析的HITS算法研究 [J].
李玥 ;
刘发升 .
软件导刊, 2008, (11) :70-72
[2]   基于词频差异的特征选取及改进的TF-IDF公式 [J].
罗欣 ;
夏德麟 ;
晏蒲柳 .
计算机应用, 2005, (09) :2031-2033
[3]  
开发自己的搜索引擎.[M].邱哲; 符滔滔; 编著.人民邮电出版社.2007,