“数据库主成份提取”方法及其应用

被引:3
作者
夏骄雄
徐俊
吴耿锋
机构
[1] 上海大学计算机工程与科学学院
关键词
数据预处理; 数据库主成份提取; 主成份分析; 数据挖掘; 数据仓库;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
庞大数据库中所蕴藏着丰富而有益的数据信息正随着数据挖掘技术的发展得到进一步分析和挖掘。数据仓库作为数据挖掘的重要平台,其质量的高低将直接影响数据挖掘的效率。构建数据仓库是数据预处理的主要目标之一,“数据库主成份提取”方法可以在信息损失最小的前提下,利用了一种降维的方法,用少数综合变量来概括原多变量的数据库,使重新构建的数据仓库的数据量相对减少,使得数据类的概率分布尽可能的接近使用所有属性的原分布,从而使重新构建的数据仓库中的数据挖掘更加容易执行和高效率。数据库主成份提取分析方法对主成份的解释可以进一步明确影响整个数据仓库构成的主要因素和构成数据仓库系统的主要特征。
引用
收藏
页码:134 / 137+202 +202
页数:5
相关论文
共 3 条
[1]   数据挖掘中的统计方法概述 [J].
赵广社 ;
张希仁 .
计算机测量与控制, 2003, (12) :914-917
[2]   数据质量和数据清洗研究综述 [J].
郭志懋 ;
周傲英 .
软件学报, 2002, (11) :2076-2082
[3]  
Real-world Data is Dirty: Data Cleansing and The Merge/Purge Problem[J] . Mauricio A. Hernández,Salvatore J. Stolfo.Data Mining and Knowledge Discovery . 1998 (1)