统计数据预处理的理论与方法述评

被引:36
作者
程开明
机构
[1] 浙江工商大学统计与数学学院
关键词
数据质量; 数据预处理; 缺失值; 异常值; 数据诊断;
D O I
暂无
中图分类号
C8 [统计学];
学科分类号
020208 ; 0714 ;
摘要
统计数据预处理是提升数据质量的重要阶段,包括数据审查、数据清理、数据转换和数据验证四大步骤。根据处理对象的特点及每一步骤的不同目标,统计数据预处理可采用的方法包括描述及探索性分析、缺失值处理、异常值处理、数据变换技术、信度与效度检验、宏观数据诊断等六大类。选用恰当的方法开展统计数据预处理,有利于保证数据分析结论真实、有效。
引用
收藏
页码:98 / 103
页数:6
相关论文
共 11 条
[1]   数据挖掘质量问题探讨 [J].
李金昌 ;
徐雪琪 .
统计研究, 2004, (07) :49-52
[2]   论什么是统计数据质量 [J].
李金昌 .
统计与决策, 1998, (09) :6-8
[3]   论统计调查质量评价的信度与效度 [J].
隗斌贤 ;
程利仲 .
浙江统计, 1997, (08) :18-20
[4]  
宏观经济统计数据诊断[M]. 清华大学出版社 , 周建著, 2005
[5]  
中国经济增长速度研究与争论[M]. 中信出版社 , 岳希明,张曙光,许宪春编, 2005
[6]  
缺失数据统计分析[M]. 中国统计出版社 , (美)RoderickJ.A.Little,(美)DonaldB.Rubin著, 2004
[7]  
可视化数据挖掘[M]. 电子工业出版社 , (美)TomSoukup,(美)IanDavidson著, 2004
[8]  
描述统计[M]. 中国人民大学出版社 , 贾俊平编著, 2003
[9]  
市场调查与分析[M]. 中国统计出版社 , 柯惠新,丁立宏编著, 2000
[10]   Data preparation process for construction knowledge generation through knowledge discovery in databases [J].
Soibelman, L ;
Kim, H .
JOURNAL OF COMPUTING IN CIVIL ENGINEERING, 2002, 16 (01) :39-48