基于压缩稀疏矩阵矢量相乘的文本相似度计算

被引:7
作者
霍华
冯博琴
机构
[1] 西安交通大学电子与信息工程学院
关键词
稀疏矩阵; 相似度; 信息检索; 矢量模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
在信息检索矢量模型的基础上,提出了一种基于压缩稀疏矩阵矢量相乘的文本相似度计算方法,具有矢量模型计算简单和速度快的特点.该方法采用压缩稀疏矩阵矢量空间存储数据,在相似度计算和数据存储时不需要考虑文本矢量矩阵中的零元素,大大减少了计算量和存储空间,从而使信息检索系统运行效率显著提高.仿真实验表明,上述方法比基于矢量模型的传统反向索引机制节省了38%的存储空间.
引用
收藏
页码:988 / 990
页数:3
相关论文
共 2 条
  • [1] 搜索引擎与信息获取技术.[M].徐宝文;张卫丰著;.清华大学出版社.2003,
  • [2] 信息组织与检索.[M].李国辉等编著;.科学出版社.2003,