基于改进海明距离的二元表示聚类研究

被引:1
作者
姜士强
杨济亭
任芹玉
机构
[1] 天津大学管理学院
关键词
聚类; 二元树; 海明距离;
D O I
10.13274/j.cnki.hdzj.2013.04.029
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
文中提出了一种二元表示聚类方法。首先,将要研究的实体以属性串的方式表达,并通过二元树转化为二进制串。其次,采用改进的海明距离代替欧氏距离计算二进制串之间的相似度。该方法通过属性加权,使计算结果更加贴近现实,并将实体以‘01’编码方式表示,简化了计算,提升了运算效率。最后,选取1796家上市公司的73个财务指标进行实验,结果表明,该方法对海量数据的处理表现良好。
引用
收藏
页码:88 / 91
页数:4
相关论文
共 3 条
[1]   基于Web使用挖掘技术的聚类算法改进 [J].
李诗诗 ;
方寿海 .
计算机工程与设计, 2009, 30 (22) :5182-5184
[2]   Developing a feature weight self-adjustment mechanism for a K-means clustering algorithm [J].
Tsai, Chieh-Yuan ;
Chiu, Chuang-Cheng .
COMPUTATIONAL STATISTICS & DATA ANALYSIS, 2008, 52 (10) :4658-4672
[3]  
Data Mining by Means of Binary Representation: A Model for Similarity and Clustering[J] . Zippy Erlich,Roy Gelbard,Israel Spiegler.Information Systems Frontiers . 2002 (2)