数据缺失时反映变量均值的经验似然置信区间

被引：0

作者：

庞伟才

机构：

[1] 广西师范大学

关键词：

经验似然; 数据缺失; 线性回归; 非参数回归; 置信区间;

D O I：

暂无

年度学位：

2006

学位类型：

硕士

导师：

秦永松;

摘要：

本文在三种情型下讨论了数据缺失时回归模型反映变量均值的经验似然置信区间一.协变量和反映变量都缺失时回归模型反映变量均值的经验似然置信区间考虑非参数回归模型Y = m （ X ）+ε （1.1）其中X为d维随机协变量,Y为一维反映变量, m （ i ）为未知回归函数,ε为随机误差,且Eε= 0, 0 <σ~ 2 = Eε2<∞,ε与X独立.在实践中,我们通常得到一组不完全的样本其中与δY相互独立,且（ X , Y ,ε）与（δX ,δY）相互独立,此条件蕴含（MCAR）条件,即P （δY = 1Y）=P（δY=1）=c1, P （δX = 1X）=P（δX=1）=c2, c1 , c2为常数.定义几个集合针对数据Yi的不同缺失情况,我们分别给出下列补充（a）当i∈S rr∪Smr ,不补充, （b）当i∈Srm ,用为核函数, hn为窗宽,且hn→0当n→∞, （c）当i∈Smm,用补充Yi, 这样我们得到Y的完全样本为（1.2）为了避免m∧n（·）的分母出现零,我们先做一些修正,令其中bn > 0,且bn→0当n→∞,用修正得到Y的完全样本为（1.3）类似于Owen（1988）,可得θ= EY的对数经验似然比（1.4）其中λn =λn （θ）满足下列方程（1.5）记f （i）为X的概率密度函数,假设下面的条件成立（C.f） f （ x ）有直到k （ > d）阶的有界偏导数. （C.m） m （ x ）有直到k （ > d）阶的有界偏导数. （C.Y） EY2<∞.（C.K）（i） K （ i ）为有有界支撑的有界核函数. （ii） K （ i ）为k阶核. （C. hn ）定理1.1在上面的假设条件下,如果θ为真参数,则有（1.6）其中χ1～2是自由度为1的标准χ2变量, 由于非标准的χ2分布不能对θ作区间估计,故我们需引入调整对数经验似然比.见（第5页）定理1.2在定理1.1的假设下,如果θ为真参数,则渐近χ1～2分布.即,其中P （χ1～2≤cα） = 1-α. 二.同模型下数据缺失时线性回归模型反映变量均值的经验似然置信区间考虑两独立总体（X1 , Y1）,（X2 , Y2）,（Xi , Yi ）为Rd×R1上的随机向量, i = 1,2,假设它们都有相同的线性回归模型Y = Xτβ+ε （ 2.1）其中β为d维未知常向量,ε为随机误差,且Eε= 0, 0 <σ2 = Eε2<∞,ε与X独立.实践中,我们通常得到总体（ X 1 , Y1 ）的样本为完全样本( X11 , Y11), ,( Xn11 , Yn11),得到总体（ X2 , Y2 ）的样本为不完全样本( X12 ,*), ,( Xn22,*,其中*表示Yi2全部缺失.利用总体（ X1 , Y1 ）的完全样本构造β的最小二乘估计（2.2）因此,我们可以用补充Yi2.类似于Owen（1988）,可得θ= EY2的对数经验似然比 2.3)其中满足下列方程（2.4）定理2.1假设如果θ为真参数,则有（2.5）其中是自由度为1的χ2变量. 由于非标准的χ2分布不能对θ作区间估计,故我们需引入调整的对数经验似然比.见（第13页）定理2.2在定理2.1的假设下,如果θ为真参数,则渐近χ1～2布,即,其中P （χ1～2≤cα） = 1-α. 三.同模型下数据缺失时非参数回归模型反映变量均值的经验似然置信区间考虑两独立总体（ X1 , Y1 ）,（ X2 , Y2 ）,（ Xi , Yi ）为R1×R1上的随机向量, i = 1,2,假设它们都有相同的非参数回归模型Y = m （ X ）+ε （3.1）其中m （i）为未知回归函数,ε为随机误差,且Eε= 0, 0 <σ2 = Eε2<∞,ε与X独立.实践中,我们通常得到总体（ X1 , Y1 ）的样本为完全样本（ X 11 , Y1 1 ）, ,（ X n1 1 , Yn 11）,得到总体（ X 2 , Y2 ）的样本为不完全样本（ X 12 ,*）, ,（ X n22,*）,其中*表示Yi 2全部缺失,利用总体（ X 1 , Y1 ）的完全样本构造m （ x ）的估计（3.2）其中K （ i ）为核函数,h为窗宽,且h→0当n1→∞,因此,可以用补充Yi 2.类似于Owen（1988）,可得θ= EY2的对数经验似然比（3.3）其中满足下列方程（3.4）假设下面的条件成立（1） K （ i ）为二次可微的对称密度函数. （2） njh4→0, njh→∞, j= 1,2. （3） n/n2→λ,0<λ<∞. （4） m （ X ）的一阶和二阶导数m （1）（ X ）, m （2）( X )都存在并且都是连续有界函数. （5） X 1和X 2有共同的紧支撑,都有二次连续可微密度函数,且0, 1,2f XjX > c > j= . （6） EY2 2<∞. 定理3.1在上面的假设条件下,如果θ为真参数,则有（3.5）其中是自由度为1的标准χ2变量. 由于非标准的χ2分布不能对θ作区间估计,故我们需引入调整的对数经验似然比2.见（第20页）定理3.2在定理3.1的假设下,如果θ为真参数,则渐近χ1～2分布,即,其中P （χ1 2≤cα） = 1-α.

引用

页数：46

共 3 条

[1]

数据缺失时线性回归统计推断 [D].