区间主成分分析方法的比较

被引:8
作者
李汶华
郭均鹏
机构
[1] 天津大学管理学院
关键词
区间数; 主成分分析; 顶点法; 中点法; 效度;
D O I
暂无
中图分类号
O212 [数理统计];
学科分类号
020208 ; 070103 ; 0714 ;
摘要
简述了区间数据主成分分析(PCA)的两种主要方法——顶点法(V-PCA)和中点法(C-PCA),并对其进行了合理化改进。研究表明,两种方法的协方差矩阵有极大的相似性。在研究区间数距离的基础上,定义了一种基于Hausdorff距离的评价模型方法优劣的效度指标,并通过模拟的方法,对这两种方法进行了比较研究。结果表明:两种方法具有较强的相似性;随着变量数和样本数的增加,两种方法的效度均有所下降;在同样的样本数条件下,中点法适合变量数较大的情形,而顶点法更适合于变量数较小的情形。最后,给出了区间PCA方法选择及效度测量的应用步骤和一个算例。
引用
收藏
页码:94 / 98
页数:5
相关论文
共 5 条
[1]  
科学计算技术与Matlab.[M].刘东毅等编著;刘则毅主编;.科学出版社.2001,
[2]  
实用多元统计分析.[M].方开泰编著;.华东师范大学出版社.1989,
[3]   一种海量数据的分析技术——符号数据分析及应用 [J].
胡艳 ;
王惠文 .
北京航空航天大学学报(社会科学版), 2004, (02) :40-44
[4]   A least squares approach to principal component analysis for interval valued data [J].
D'Urso, P ;
Giordani, P .
CHEMOMETRICS AND INTELLIGENT LABORATORY SYSTEMS, 2004, 70 (02) :179-192
[5]   Principal component analysis of interval data: a symbolic data analysis approach [J].
Lauro, CN ;
Palumbo, F .
COMPUTATIONAL STATISTICS, 2000, 15 (01) :73-87