基于信息熵的标称变量聚类算法研究

被引:5
作者
王燕
机构
[1] 兰州理工大学计算机与通信学院
关键词
信息熵; 聚类; 标称变量;
D O I
暂无
中图分类号
TP311.131 [];
学科分类号
摘要
通过对标称数据的分析,提出了一种基于信息熵和层次聚类思想的标称数据聚类算法。算法采用信息熵度量对象之间的相似性,通过数据直接计算相似性阈值。实验证明算法是可行并且有效的。
引用
收藏
页码:1904 / 1905
页数:2
相关论文
共 2 条
[1]
一种基于自动阈值发现的文本聚类方法 [J].
张猛 ;
王大玲 ;
于戈 .
计算机研究与发展, 2004, (10) :1748-1753
[2]
Extensions to the k-means algorithm for clustering large data sets with categorical values [J].
Huang, ZX .
DATA MINING AND KNOWLEDGE DISCOVERY, 1998, 2 (03) :283-304