随着大数据时代的到来,一种通过计算机算法完成数据处理的技术——数据挖掘应运而生。聚类分析法在数据挖掘中属于无监督方法,可以自动从样本数据出发进行聚类,而在分析之前无需确定分类的标准。由于聚类分析上述的这些特点,使其在很多领域中都得到了广泛的应用。本文针对传统模糊C均值算法对初始中心敏感,聚类类别数确定困难,收敛速度缓慢且容易陷入局部最优等问题进行改进研究,得到了改进的模糊C均值算法IFCM(Improved Fuzzy C-means)。论文首先从信息粒度的角度出发,运用粒度分析原理,根据信息粒度的内聚度和耦合度构造聚类有效性函数,通过有效性函数对聚类结果进行评价,然后采用点密度函数选取初始聚类中心,改进了传统算法随机选择初始化聚类中心的不足,使得算法收敛速度更快并且提高了聚类结果的有效性。针对聚类类别数不稳,采取逐次递减类别数合并聚类中心的方法,最后根据聚类有效性函数判断得到最佳聚类结果。通过仿真实验,证明了改进算法弥补了传统FCM算法对初始值敏感、聚类类别数不稳定以及收敛速度慢的不足。IFCM算法的分类结果更加合理,提高了聚类算法的有效性。论文进一步将改进算法应用到变电所负荷特性分类中,取得了较好的分类效果,为电力负荷应用决策提供了有益参考。