<正> 在应用回归分析中,最伤脑筋的问题是如何挑选解释变量,可以说是回归分析的一个老大难问题,至今仍未得到很好的解决.举例说明,人们知道,肺癌的发生率 y 与吸烟量 x1之间有相当显著的相关关系.可是,一天吸50支以上的大烟鬼未必都得肺癌,相反地,完全不吸烟的人也有得肺癌的.可见只有吸烟量 x1还不能完全解释肺癌发生率 y.要解释肺癌发生率 y,也许还得把其它变量,诸如大气中含有的某种致癌物质的量 x2以及与遗传体质有关的量 x3等也考虑进去.这样是不是说把与 y 有关的所有变量都考虑进去作回归分析才行呢?如果解释变量中有