基于余弦相似度的文本空间索引方法研究

被引:55
作者
张振亚
王进
程红梅
王煦法
机构
[1] 中国科学技术大学电子工程与信息科学系
[2] 中国科学技术大学计算机系
[3] 安徽师范大学数学系
[4] 中国科学技术大学计算机系 合肥 中国科学技术大学计算机系 合肥
[5] 合肥
[6] 芜湖
[7] 合肥
基金
中国博士后科学基金;
关键词
相似度; 空间索引; 层次式聚类;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
基于相似度的数据空间索引在数据挖掘及数据可视化等方面有着重要的应用。本文以新闻的标题为研究对象,提出了以 CrossAVL为基础的文本对象层次式聚类方法以及文本信息空间索引算法 FastMap-MDS,有效地保持了文本对象间的相似信息。实验表明,该方法具有较高的效率和精度。
引用
收藏
页码:160 / 163
页数:4
相关论文
共 2 条
  • [1] 基于神经网络的增量式数据索引机制研究
    陈恩红
    塔建庆
    张振亚
    王煦法
    [J]. 小型微型计算机系统, 2003, (10) : 1783 - 1786
  • [2] Multidimensional scaling: I. Theory and method[J] . Warren S. Torgerson.Psychometrika . 1952 (4)