基于自适应权重的函数型数据聚类方法研究

被引:14
作者
王德青 [1 ,2 ]
朱建平 [2 ]
王洁丹 [2 ,3 ]
机构
[1] 中国矿业大学管理学院
[2] 厦门大学数据挖掘研究中心
[3] 湖南大学金融与统计学院
关键词
函数型数据; 主成分聚类分析; 自适应赋权; 极端情形;
D O I
10.13860/j.cnki.sltj.20150122-025
中图分类号
O212.1 [一般数理统计];
学科分类号
摘要
基于有限维离散数据的传统聚类分析并不能直接用于函数型数据的分类挖掘。本文针对函数型数据的稀疏性和无穷维特殊性展开讨论,在综合剖析现有函数型聚类方法优势与不足的基础上,依据聚类指标的信息量差异重构加权主成分距离为函数相似性测度,提出了一种函数型数据的自适应权重聚类分析。相对同类函数型聚类算法,新方法的核心优势在于:(1)自适应赋权的距离函数体现了聚类指标分类效率的差异,并且有充分的理论基础保证其必要性和客观合理性;(2)基于有限维离散数据的聚类实现了无限维连续函数的聚类,能够显著降低计算成本。实证检验表明,新方法的分类正确率明显提高,能够有效解决传统聚类算法极端情形下的失效问题,有着复杂函数型数据分类问题下的灵活性和普遍适用性。
引用
收藏
页码:84 / 92
页数:9
相关论文
共 18 条