Web信息检索中主题精选算法的研究与改进

被引:3
作者
韩亚洪
许卓明
董逸生
机构
[1] 河海大学计算机及信息工程学院
[2] 东南大学计算机科学与工程系
[3] 东南大学计算机科学与工程系 南京安阳师范学院计算机科学系 河南安阳
[4] 南京 河海大学计算机及信息工程学院 南京
[5] 南京
关键词
主题精选; HITS; 多粒度; 链接分析; Web信息检索;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
搜索引擎是目前最主要的Web信息检索工具,然而它的效果还不能令人满意。基于Web链接结构的主题精选算法的链接分析迭代往往会收敛于链接图中与查询主题不太相关的紧密交织区域(TKC),从而导致主题偏移。笔者对经典主题精选算法HITS的分析表明该算法还有给不同的Web站点规定了不平等的影响权重以及不能满足用户多粒度的信息需求等缺点。文章在分析主题精选算法研究的基础上针对其不足提出了改进算法g-HITSc,实验表明该算法是合理和有效的。
引用
收藏
页码:174 / 178
页数:5
相关论文
共 2 条
[1]  
Appliedmuitivariatestatisticalanalysis .2 FangKai-Tai. EastChinaNormalUniversityPress . 1989
[2]  
Next generation Web search: setting our sites .2 Hearst,M.A. Bulletin of the technical committee on data engineering, IEEE Computer Society . 2000