RKHS-based functional nonparametric regression for sparse and irregular longitudinal data

被引:8
作者
Avery, Matthew [1 ]
Wu, Yichao [2 ]
Helen Zhang, Hao [3 ]
Zhang, Jiajia [4 ]
机构
[1] Inst Def Anal, Operat Evaluat Div, Alexandria, VA USA
[2] N Carolina State Univ, Dept Stat, Raleigh, NC 27695 USA
[3] Univ Arizona, Dept Math, Tucson, AZ 85721 USA
[4] Univ S Carolina, Dept Epidemiol & Biostat, Columbia, SC 29208 USA
来源
CANADIAN JOURNAL OF STATISTICS-REVUE CANADIENNE DE STATISTIQUE | 2014年 / 42卷 / 02期
基金
美国国家科学基金会; 美国国家卫生研究院;
关键词
Functional nonparametric regression; longitudinal data; RKHS; sparse and irregular; MODELS;
D O I
10.1002/cjs.11215
中图分类号
O21 [概率论与数理统计]; C8 [统计学];
学科分类号
020208 ; 070103 ; 0714 ;
摘要
This paper focuses on sparse and irregular longitudinal data with a scalar response. The predictor consists of sparse and irregular observations on predictor trajectories, potentially contaminated with measurement errors. For this type of data, Yao, Muller, & Wang (2005a) proposed a principal components analysis through conditional expectation (PACE) approach, which is capable of predicting each predictor trajectory based on sparse and irregular observations. Nonparametric functional data analysis provides an attractive alternative due to its high flexibility. Early work includes functional additive models as in Muller & Yao (2008) and Ferraty & Vieu (2006), which are mainly based on kernel smoothing methods. In this work, we propose a new functional nonparametric regression framework based on reproducing kernel Hilbert spaces (RKHS). The proposed method involves two steps. The first step is to estimate each predictor trajectory based on sparse and irregular observations using PACE. The second step is to conduct a RKHS-based nonparametric regression using the estimated predictor trajectories. Our approach shows improvement over existing methods in simulation studies as well as in a real data example. The Canadian Journal of Statistics 42: 204-216; 2014 (c) 2014 Statistical Society of Canada Resume Resume Les auteurs se penchent sur les donnees longitudinales eparses et irregulieres presentant une variable reponse scalaire. Les predicteurs sont des observations eparses et irregulieres sur leur trajectoire qui peuvent etre contaminees par des erreurs de mesure. Pour ce type de donnees, Yao, Muller et Wang (2005a) proposent une analyse en composantes principales par les esperances conditionnelles (APEC) qui permet de predire la trajectoire de chaque predicteur sur la base de donnees eparses et irregulieres. L'analyse fonctionnelle non parametrique de donnees presente une option interessante compte tenu de sa grande flexibilite. Les travaux de Muller et Yao (2008) et ceux de Ferraty et Vieu (2006) traitent d'ailleurs des modeles fonctionnels additifs en se basant principalement sur le lissage par la methode du noyau. Dans le present article, les auteurs proposent un nouveau cadre pour la regression fonctionnelle non parametrique base sur un espace de Hilbert a noyau reproduisant (EHNR). La methode proposee comporte deux etapes. D'abord, la trajectoire de chaque predicteur est estimee a partir de donnees eparses et irregulieres a l'aide de l'APEC. Ensuite, une regression non parametrique basee sur l'EHNR est ajustee en se basant sur la trajectoire estimee des predicteurs. L'approche proposee presente des ameliorations par rapport aux methodes existantes dans le cadre d'etudes de simulation et d'exemples bases sur des donnees reelles. La revue canadienne de statistique 42: 204-216; 2014 (c) 2014 Societe statistique du Canada
引用
收藏
页码:204 / 216
页数:13
相关论文
共 29 条