后缀树聚类算法在元搜索引擎中的应用

被引:5
作者
冯冰洁
杨天奇
机构
[1] 广东广州暨南大学信息科学技术学院
基金
广东省自然科学基金;
关键词
元搜索引擎; 文本聚类; 后缀树;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
元搜索引擎结果覆盖面广,易于维护,实现简单,能够提供比较全面的结果给用户。后缀树聚类算法(STC)充分考虑了文本集合的语言学特征,并引入了短语特性,从而产生了较好的聚类效果。本文将后缀树聚类算法应用到元搜索引擎中,从而增强了结果的可浏览性,提高了搜索的精度。实验结果表明,STC算法在查准率和时间性能方面都高于传统的聚类算法。
引用
收藏
页码:204 / 206
页数:3
相关论文
共 5 条
  • [1] 搜索引擎中的聚类浏览技术
    李红梅
    丁振国
    周水生
    周利华
    [J]. 中文信息学报, 2008, (03) : 56 - 63
  • [2] 中文搜索引擎中的分词技术研究
    房志峰
    [J]. 科学技术与工程, 2008, (09) : 2481 - 2483+2506
  • [3] 文本聚类算法的质量评价
    刘务华
    罗铁坚
    王文杰
    [J]. 中国科学院研究生院学报, 2006, (05) : 640 - 646
  • [4] 基于近似网页聚类的智能搜索系统
    彭曙蓉
    蔡蕾
    王耀南
    [J]. 微计算机信息, 2006, (12) : 283 - 285
  • [5] 元搜索引擎及其主要技术
    李广建
    黄崑
    不详
    [J]. 情报科学 , 2002, (02) : 175 - 179