逐步回归分析的拓展
第37卷 第5期1998年 9月中山大学学报(自然科学版)
ACTA SCIENTIARUM NATURALIUM
UNIVERSITATIS SUNYATSENI
Vol137 No15Sep1 1998
逐步回归分析的拓展
(Ξ
摘 要 ,,(后退)步为一单元步,用F检验来判
,同时能减低向后消元法产生.
关键词 逐步回归,单元步,多重共线性,分类号 O21211
F检验
1 提出问题
在回归分析中,对解析变量的选择很重要.逐步回归法能使回归式子保留几个最为显著的解析变量,但由于其每一前进步只选择1个显著变量,很可能排斥了一些重要变量.
在表1中,1代表农业,21代表制造业,22代表建筑业,31代表邮电运输业,32代表商业,33代表非物质服务业,Xij代表ij行业滞后一年的国内生产总值.X代表实际国内生产总值的增长量.
下面的所有回归都去掉了1991年(由于回归滞后一阶,实际是去掉1990年).
用向后消元法得
X=-2866163+3126X1-0197X
21
+12166X22+6193X31-6150X(3119)
(2112)
32
(-5120)(4150)(-3102)(-5135)(1)
R2=0194 DW=2100 ESS=31455710
用逐步回归法得
X=-2845168+3169X
1
-3104X(-4110)
32
(-5173)
(5188)(2)
R2=0187 DW=1145 ESS=68059819
与(1)式相比,(2)式中保留了最显著变量X1,X32而去掉了变量X21,X22,X31.人们面临的问题是:一方面逐步回归能避免共线性,但入选的变量很少.在某些情况下与分析目标不符;另一方面,向后消元法虽然纳入较多变量,但容易导致共线性,从而损害了回归结论的精确性.为避免多重共线性又能纳入较多变量,目前有2类方法,第一类方法如岭回归,主成分回归,偏最小二乘法.
[1]
但这些方法是以有偏估计为代价的.另一
Ξ收稿日期:1998203202 张华嘉,男,34岁,讲师
表1 1978~1995年各行业实际产值和实际国内生产总值增长量
Tab11 Therealoutputvaluesinvariousindustries
andtheincreaseofrealGDPfrom1978to1995 108元
年份X1X21X[***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********]698125①各年算出 资料来源:《中国统计年鉴》
X
22
X
31
X
32
X
33
138120
[***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********][***********]652600105类方法是先用向后消元法得
Y=Β0+Β1X1+…+ΒnX
n
(3)
再用一些方法检验X1,…,Xn是否有多重共线性,然后去掉引起共线性的变量,如Farrar2
[2]
Glauber检验和Klein方法.Farrar2Glauber检验,对任一i=1,2,…,n,对
Xi=Β0+Β1X1+…+Βi-1Xi-1+Βi+1Xi+1+…+ΒnXn回归,得判别系数Ri,
2
令 Fi=F(n-1,N-n)
(1-Ri2)