一种特征加权的聚类算法框架

被引:5
作者
高滢
刘大有
徐益
机构
[1] 吉林大学计算机科学与技术学院
[2] 吉林大学符号计算与知识工程教育部重点实验室
基金
国家自然科学基金重大项目;
关键词
聚类算法框架; 特征加权; 基于距离的聚类; 基于密度的聚类;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
为了考虑数据各维特征对聚类的不同贡献,并把有监督特征评价方法应用到无监督分类问题中,提出一种特征加权的聚类算法框架。该框架首先通过某种聚类算法对数据聚类,然后,根据聚类结果,采用有监督特征评价方法学习各维特征的权值,再根据特征权值重新聚类,之后再次学习特征权值,该过程反复迭代,直至算法收敛或达到指定的迭代次数。欧几里德空间内基于距离、基于密度的聚类算法均适用于本框架。基于本框架,采用模糊C均值聚类算法(FCM)、密度聚类算法(DBSCAN),并通过信息增益特征评价、ReliefF特征评价方法,对多个UCI数据集进行了实验,验证了该框架的有效性。
引用
收藏
页码:152 / 154
页数:3
相关论文
共 5 条
  • [1] 基于属性权重的Fuzzy C Mean算法
    王丽娟
    关守义
    王晓龙
    王熙照
    [J]. 计算机学报, 2006, (10) : 1797 - 1803
  • [2] 基于特征加权的模糊聚类新算法
    李洁
    高新波
    焦李成
    [J]. 电子学报, 2006, (01) : 89 - 92
  • [3] Improving fuzzy c-means clustering based on feature-weight learning
    Wang, XZ
    Wang, YD
    Wang, LJ
    [J]. PATTERN RECOGNITION LETTERS, 2004, 25 (10) : 1123 - 1132
  • [4] A Review and Empirical Evaluation of Feature Weighting Methods for a Class of Lazy Learning Algorithms[J] . Dietrich Wettschereck,David W. Aha,Takao Mohri.Artificial Intelligence Review . 1997 (1)
  • [5] A New Dependency and Correlation Analysis for Features .2 Qu Guang Zhi,Yousif M. IEEE Transactions on Knowledge and Data Engineer . 2005