高维空间中数据的相似性度量

被引:20
作者
贺玲
吴玲达
蔡益朝
机构
[1] 国防科技大学信息系统与管理学院
关键词
维度灾难; 相似度量; 距离度量;
D O I
暂无
中图分类号
O241 [数值分析];
学科分类号
070102 ;
摘要
高维空间中数据之间的相似性度量是目前数据挖掘、信息处理与检索等领域所面临的一个重要问题.文章在总结分析了高维数据的特点以及现有的一些度量方法的基础上,提出了一种新的度量方式,该方法在对高维数据进行相似性度量之前,首先对原始数据空间进行网格划分.文章的最后对其有效性作了定量分析,实验证明,该方式是行之有效的.
引用
收藏
页码:189 / 194
页数:6
相关论文
共 7 条
[1]  
The dwarf data cube eliminates the high dimensionality curse. Y. Sismanis,and N. Roussopoulos. TR-CS4552 . 2003
[2]  
Flexible Metric Nearest Neighbor Classification. Jerome H.Friedman. Technical Report, Department of Statistics, Stanford University . 1994
[3]  
A pprox im ate nearest ne ighbors:T ow ard rem ov ing the curse of d im ensiona lity. P itor Indyk,R a jeev M otvan i. ACM Sym posium on Theory of C om pu ting . 1998
[4]  
A daptive C on tro l P rocesses:A G u ided T our. Bellm ann R. . 1961
[5]  
M inder R eader:Q uery database through m u ltip le exam p les. Ish ikaw a Y,Subram anya R,Fa loustos C. P rocof VLDB . 1998
[6]  
W hen is nearest ne ighborm ean ing fu l?. Beyer K,G o ldste in J,R am arkrishnan R. P roc of the In t C on f D atabaseTheorie . 1999
[7]   逐维聚类的相似度索引算法 [J].
汪祖媛 ;
庄镇泉 ;
王煦法 .
计算机研究与发展, 2004, (06) :1003-1009