基于自适应权重的函数型数据聚类方法研究

被引：14

作者：

王德青 ^{[1
,2
]}

朱建平 ^{[2
]}

王洁丹 ^{[2
,3
]}

机构：

[1] 中国矿业大学管理学院

[2] 厦门大学数据挖掘研究中心

[3] 湖南大学金融与统计学院

来源：

数理统计与管理 | 2015年 / 34卷 / 01期

关键词：

函数型数据; 主成分聚类分析; 自适应赋权; 极端情形;

D O I：

10.13860/j.cnki.sltj.20150122-025

中图分类号：

O212.1 [一般数理统计];

学科分类号：

摘要：

基于有限维离散数据的传统聚类分析并不能直接用于函数型数据的分类挖掘。本文针对函数型数据的稀疏性和无穷维特殊性展开讨论,在综合剖析现有函数型聚类方法优势与不足的基础上,依据聚类指标的信息量差异重构加权主成分距离为函数相似性测度,提出了一种函数型数据的自适应权重聚类分析。相对同类函数型聚类算法,新方法的核心优势在于:(1)自适应赋权的距离函数体现了聚类指标分类效率的差异,并且有充分的理论基础保证其必要性和客观合理性;(2)基于有限维离散数据的聚类实现了无限维连续函数的聚类,能够显著降低计算成本。实证检验表明,新方法的分类正确率明显提高,能够有效解决传统聚类算法极端情形下的失效问题,有着复杂函数型数据分类问题下的灵活性和普遍适用性。

引用

页码：84 / 92

页数：9

共 18 条

[1] 中国创新能力区域差异的静态与动态分析—基于拓展聚类模型层级划分的角度
王德青
朱建平
谢邦昌
[J]. 数理统计与管理, 2014, 33 (05) : 910 - 921
[2] 中国区域创新能力静态分析——基于自适应赋权主成分聚类模型
朱建平
王德青
方匡南
[J]. 数理统计与管理, 2013, 32 (05) : 761 - 768
[3] 一种基于函数型数据的综合评价方法研究
苏为华
孙利荣
崔峰
[J]. 统计研究, 2013, 30 (02) : 88 - 94
[4] 多指标面板数据融合聚类分析
任娟
[J]. 数理统计与管理, 2013, 32 (01) : 57 - 67
[5] 主成分聚类分析有效性的思考
王德青
朱建平
谢邦昌
[J]. 统计研究, 2012, 29 (11) : 84 - 87
[6] 一种函数型数据系统聚类分析方法应用
王劼
黄可飞
王惠文
李莹
[J]. 北京航空航天大学学报(社会科学版), 2011, 24 (01) : 86 - 88+102
[7] 基于主成分的改进雷达图及其在综合评价中的应用
王德青
万永波
王翔
狄让丽
[J]. 数理统计与管理, 2010, 29 (05) : 883 - 889
[8] 面板数据聚类方法及应用
李因果
何晓群
[J]. 统计研究, 2010, 27 (09) : 73 - 79
[9] 一种函数型数据的聚类分析方法
王劼
黄可飞
王惠文
[J]. 数理统计与管理, 2009, 28 (05) : 839 - 844
[10] 基于多维面板数据的聚类方法探析及实证研究
肖泽磊
李帮义
刘思峰
[J]. 数理统计与管理, 2009, 28 (05) : 831 - 838

← 1 2 →