基于信息熵的标称变量聚类算法研究

被引：5

作者：

王燕

机构：

[1] 兰州理工大学计算机与通信学院

来源：

计算机应用 | 2006年 / 08期

关键词：

信息熵; 聚类; 标称变量;

D O I：

暂无

中图分类号：

TP311.131 [];

学科分类号：

摘要：

通过对标称数据的分析,提出了一种基于信息熵和层次聚类思想的标称数据聚类算法。算法采用信息熵度量对象之间的相似性,通过数据直接计算相似性阈值。实验证明算法是可行并且有效的。

引用

收藏

页码：1904 / 1905

页数：2

相关论文

共 2 条

[1]

一种基于自动阈值发现的文本聚类方法 [J].

张猛 ;

王大玲 ;

于戈 .

计算机研究与发展, 2004, (10) :1748-1753

[2]

Extensions to the k-means algorithm for clustering large data sets with categorical values [J].

Huang, ZX .

DATA MINING AND KNOWLEDGE DISCOVERY, 1998, 2 (03) :283-304