含有周期性的时间序列中随机型缺失数据的填补方法

被引:13
作者
张熙 [1 ,2 ]
李济宾 [2 ]
张晋昕 [2 ]
机构
[1] 复旦大学公共卫生学院卫生统计与社会医学教研室
[2] 中山大学公共卫生学院医学统计与流行病学系
关键词
时间序列; 缺失数据; 周期性填补; spline填补法;
D O I
暂无
中图分类号
O211.61 [平稳过程与二阶矩过程];
学科分类号
070103 [概率论与数理统计];
摘要
目的用模拟研究的方法,对含周期性的时间序列数据中随机型缺失数据进行填补,比较基于周期信息的时间序列缺失值填补法(简称周期性填补法)和spline插值填补法对缺失数据的填补效果。方法利用SAS模拟产生平稳、有周期性的时间序列数据并构造随机型缺失。分别比较相同序列长度不同缺失比例和相同缺失比例不同序列长度下,两种方法的缺失值填补效果。采用NRMSE和RMSE量化填补的误差。结果相同序列长度下,随着缺失比例的增加,两种填补方法的填补误差均增加,除缺失比例为30%的RMSE在两种方法间的差异无统计学意义外,周期性填补法的NRMSE和RMSE均小于spline填补法(P<0.05)。相同缺失比例下,序列长度较短时,两种填补方法的差异无统计学意义;序列长度较长时,周期性填补法的填补效果优于spline填补法。结论总体上,周期性填补法对含有确切周期性的时间序列中缺失数据的填补效果较好。
引用
收藏
页码:475 / 477
页数:3
相关论文
共 5 条
[1]
时间序列处理的新插值方法 [J].
武艳强 ;
黄立人 .
大地测量与地球动力学, 2004, (04) :43-47
[2]
基于公开数据的SARS流行规律的建模及预报 [J].
方兆本 ;
李红星 ;
杨建萍 .
数理统计与管理, 2003, (05) :48-52+57
[3]
数值分析原理.[M].封建湖等编著;.科学出版社.2001,
[4]
SAS系统SAS/ETS软件使用手册.[M].高惠璇等编译;.中国统计出版社.1998,
[5]
Methods for imputation of missing values in air quality data sets [J].
Junninen, H ;
Niska, H ;
Tuppurainen, K ;
Ruuskanen, J ;
Kolehmainen, M .
ATMOSPHERIC ENVIRONMENT, 2004, 38 (18) :2895-2907