高维数据中的相似性度量算法的改进

被引:23
作者
邵昌昇
楼巍
严利民
机构
[1] 上海大学机电工程与自动化学院
关键词
数据挖掘; 高维数据; 相似性度量;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
高维数据之间的相似性度量问题是高维空间数据挖掘中所面临的问题之一。为了有效解决高维效应给相似性度量带来的种种问题,首先分析传统相似性度量算法,得出其局限性。再通过对传统度量算法进行改进,提出新的Close函数,以弥补传统相似性度量算法应用在高维空间时的不足。提出Close函数后,将其与几种传统的相似性度量算法作比较,得出新算法在高维空间相似性度量方面的优越性。文中最后用Matlab对该函数做了定量分析,实验证明该函数在高维空间中能有效避免噪声和维灾效应的影响。
引用
收藏
页码:1 / 4
页数:4
相关论文
共 7 条
[1]  
高维数据挖掘中若干关键问题的研究.[D].杨风召.复旦大学.2003, 02
[2]   基于聚类高维空间算法的离群数据挖掘技术研究 [J].
项响琴 ;
汪彩梅 .
计算机技术与发展, 2010, 20 (01) :124-127+131
[3]   高维数据可视化方法研究 [J].
余肖生 ;
周宁 ;
张芳芳 .
情报科学 , 2007, (01) :117-120
[4]   高维数据的可视化和快速聚类算法 [J].
杨莉 .
计算机科学, 2006, (11) :132-133+138
[5]   高维数据挖掘算法的研究与进展 [J].
陈慧萍 ;
王煜 ;
王建东 .
计算机工程与应用 , 2006, (24) :170-173
[6]   高维空间中数据的相似性度量 [J].
贺玲 ;
吴玲达 ;
蔡益朝 .
数学的实践与认识, 2006, (09) :189-194
[7]   逐维聚类的相似度索引算法 [J].
汪祖媛 ;
庄镇泉 ;
王煦法 .
计算机研究与发展, 2004, (06) :1003-1009