基于向量空间模型的并行信息检索算法

被引:8
作者
李庆华
赵彦斌
赵峰
彭进劲
机构
[1] 华中科技大学计算机科学与技术学院
[2] 国家高性能计算中心(武汉) 湖北武汉
[3] 湖北武汉
关键词
向量空间模型; 信息检索技术; 并行算法; 时间复杂度;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
基于向量空间模型的信息检索技术是较为成熟且应用广泛的信息检索技术,该技术将文档和查询信息均用向量空间表示,查询匹配问题转化为向量空间的矢量匹配问题,文档与查询的相似度可用向量之间的夹角来度量.信息检索速度是衡量信息检索技术好坏的重要指标,基于向量空间模型的信息检索之串行算法的计算复杂度为Θ(n3),本文提出了一种在Hyper-cubeSIMD模型上的并行算法,其时间计算复杂度为Θ(nlogn),该算法与传统的串行算法相比,能显著地提高查询速度.
引用
收藏
页码:1560 / 1562
页数:3
相关论文
共 2 条
[1]  
Matrices, Vector Spaces, and Information Retrieval[J] . Michael W. Berry,Zlatko Drmac,Elizabeth R. Jessup.SIAM Review . 1999 (2)
[2]   Using linear algebra for intelligent information retrieval [J].
Berry, MW ;
Dumais, ST ;
OBrien, GW .
SIAM REVIEW, 1995, 37 (04) :573-595