一种基于相似度分析的主题提取和发现算法

被引:30
作者
王晓宇
熊方
凌波
周傲英
机构
[1] 复旦大学计算机科学与工程系
[2] 复旦大学计算机科学与工程系 上海
[3] 同济大学汽车电子研究所
[4] 上海
[5] 复旦大学智能信息处理开放实验室
关键词
主题提取; 主题发现; 链接分析; Web搜索;
D O I
10.13328/j.cnki.jos.2003.09.011
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
试图从另一个角度来考察主题提取算法HITS,即提出一种基于相似度的链接分析模型来观察主题提取的过程.通过给出一种一般化的相似度定义,提出了一种仅使用链接分析来改善主题提取的质量的主题提取算法.同时,还将主题发现的功能也结合到了算法的框架中.通过该功能,用户可以搜索到次流行的主题.实验结果显示了这一新算法的两个优点:不必使用内容分析即能改善主题提取的质量以及能够进一步发现在查询结果中显现出来的不同主题.
引用
收藏
页码:1578 / 1585
页数:8
相关论文
empty
未找到相关数据