许多科学研究领域的一个基本工作是研究因素变量(协变量)对某些感兴趣变量(反映变量)的影响,回归模型为我们处理这类问题提供了一个有力的工具,由此建立起了参数、半参数和非参数回归模型的推断理论。这里我们设X和T为协变量,Y为反映变量,它们的维数分别为p、1和1,δ为指示变量。在实践中,我们经常得到如下不完全样本:
(1)样本(Xi,Yj,δxi,δyj ), i = 1,...,n,其中Xi、Yi都有缺失。当Yi缺失时0δYi= ,否则1δYi= ;当X i缺失时0δXi= ,否则1δXi= ,并且它们的缺失满足:P (δX = 1| X , Y ) = P (δX= 1= p1, P (δY = 1| X , Y ) = PδY= 1= p2,即X,Y的缺失是完全随机缺失(MCAR)的。
(2)样本( Yi ,δi , X i ,Ti),i = 1,...,n,其中X i,T i为完全样本,Y i有缺失,当δi=0时, Yi缺失,否则Yi不缺失,并且Yi的缺失满足: P (δ= 1/ Y , X , T ) = P (δ= 1/ X ,T),
即Y的缺失是随机缺失(MAR)的。在这些有缺失样本的情形下通常的推断理论就不能直接应用了。
处理不完全样本的基本方法是对那些缺失值进行补足,然后把它们作为完全样本,按照标准的统计方法来推断,本文采用的数据补足方法是利用给定的回归模型对缺失数据进行回归补足。
本文在样本(1)下讨论如下线性回归模型Y = X 'β+ν0( X)ε,在适当条件下得到了反映变量Y的均值θ的估计,并且获得其调整的经验似然统计量l^ ad(θ0)的渐近分布(定理(1.1),其中θ0为参数真值),由此可直接导出θ的经验似然置信区间,数据模拟表明此置信区间有较好的精度。本文在样本(2)下讨论如下部分线性模型Yi =Xi'β+g(Ti) + ei, i = 1,...,n,在适当条件下得到了调整的经验似然统计量l∧ n , ad(β0)的渐近分布(定理(2.1),其中β0为参数真值),由此可直接导出参数β的的经验似然置信域。主要结论如下:
定理1.1若E‖X‖2 <∞,θ0为真参数,则l^ ad(θ0)依分布收敛于χ1~2。
在部分线性模型中为得到调整的经验似然统计量l∧n, ad(β0)的渐近分布,我们用非参数回归函数核估计的方法对部分线性模型的非参数部分进行估计,为此我们取核函数为K(·) ,核窗宽h = h_n。首先给出如下假设条件:
(i) T1在[0,1]上有连续密度r(t),且
(ii)对t∈[0,1],记m1j t = E(X1j/ T1 = t) ,1≤j≤p,设g和m1j(t) ,1≤j≤p,均满足1阶Lipshitz条件;
(iii)用?表示R p中欧式范数,设E‖X‖2<∞且∑= cov(X1-E(X1/T1))为正定阵;
(iv) Ee1~4<∞;
(v)存在常数M1 , M2> 0,以及ρ> 0使得M1I(|u|≤ρ)≤K(u)≤M2I(|u|≤ρ),且在[-ρ,ρ]上K (·)是有界变差函数;
(vi) nh 2 / log n→∞, nh4→0;
(vii)记hij = X_(ij- E (Xij/Ti=t),1≤j≤p,设其中设为正定阵,其中P (X,T) = E(δ|X ,T);
(viii)
定理2.1假设条件(i)-(viii)成立,则当H0 :β=β0时