计量经济学庞皓第二版第四章习题答案
第四章习题答案
练习题4.1参考答案
ˆ。 ˆ且γˆ2=βˆ2=β(1) 存在α32
当X2和X3
(yx)(x)-(yx)(xx)ˆβ=
∑x∑x-∑xx因为
之间的相关系数为零时,即∑xx=0
()ˆ=yx(x)=yx=αˆβ
xxx
有
i2i
23i
i3i
2i
3i
2
22i
23i
2
2i
3i
2i3i23i
i2ii2i
2
22i23i22i
2
ˆ。 ˆ2=β同理可知γ3
(2)
β1=-β22i-β33iα1=-α22i
∧
∧
∧∧∧
由(1)中结论,我们可得出以下公式:
∧
∧
∧
∧
γ1=-γ33i
∧
∧
∧∧
α1+γ1=2-α22i-γ33i=2-β22i-β33i
即有:α1+γ1=+β1
因此,β1=-(α1+γ1) 从而可以说明,β1是α1与γ1的一个线性组合。
ˆˆ=var(γˆ2)且varβˆ3)。 3(3) 存在varβ2=var(α
2
∧
∧
∧
∧
∧
∧∧∧
∧
()ˆ)=var(β
()
2
23
因为
当r23=0时,
x1-r
22i
σ2
ˆ=varβ2
同理,有
()
x1-rx
2
2i
223
σ2
=
σ2
22i
ˆ2)=var(α
ˆ=var(γˆ3) varβ3
练习题4.2参考答案
根据对多重共线性的理解,逐步向前和逐步向后回归的程序都存在不足。逐步向前法不
能反映引进新的解释变量后的变化情况,即一旦引入就保留在方程中;逐步向后法则一旦某个解释变量被剔出就再也没有机会重新进入方程。而解释变量之间及其与被解释变量的相关关系与引入的变量个数及同时引入哪些变量而呈现出不同,所以要寻找到“最优”变量子集则采用逐步回归较好,它吸收了逐步向前和逐步向后的优点。
()
练习题4.3参考答案
(1)由题知,对数回归模型为:lnYt=β1+β2lnGDPt+β3lnCPIt+ui
用最小二乘法对参数进行估计得:
Dependent Variable: LOG(Y) Method: Least Squares Date: 11/17/10 Time: 23:51 Sample: 1985 2007 Included observations: 23
LOG(GDP) LOG(CPI)
C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 1.656674 -1.057053 -3.060149
Std. Error 0.092206 0.214647 0.337427
t-Statistic 17.96703 -4.924618 -9.069059
Prob. 0.0000 0.0001 0.0000 9.155303 1.276500 -1.313463 -1.165355 -1.276214 0.745639
0.992218 Mean dependent var 0.991440 S.D. dependent var 0.118100 Akaike info criterion 0.278952 Schwarz criterion 18.10482 Hannan-Quinn criter. 1275.093 Durbin-Watson stat 0.000000
ˆ=-3.060149+1.656674lnGDP-1.057053lnCPI lnYttt
(0.337) (0.092) (0.215)
t= -9.069059 17.96703 -4.924618
R2=0.992 2=0.991
(2)存在多重共线性。居民消费价格指数的回归系数的符号不能进行合理的经济意义解释,且其简单相关系数为0.964808,说明lnGDP和lnCPI存在正相关的关系。
(3)根据题目要求进行如下回归:
○1模型为:lnYt=A1+A2lnGDPt+v1i 用最小二乘法对参数进行估计得: lnYt=-4.0907+1.218573lnGDPt (0.384) (0.035) t= -10.6458 34.62222
22
R=0.983 =0.98 2 ○2模型为:lnYt=B1+B2lnCPIt+v2i 用最小二乘法对参数进行估计得: lnYt=-5.44242+2.66379lnCPIt (1.254) (0.228) t= -4.341218 11.68091
22
R=0.867 =0.86 0
3模型为:lnYt=B1+B2lnCPIt+v2i ○
用最小二乘法对参数进行估计得: lnGDPt=-1.437984+2.245971lnCPIt (0.734) (0.134)
t= -1.958231 16.814
22
R=0.931 =0.92 8
模型1、2说明:单方程拟合效果都很好,回归系数显著,判定系数较高,GDP和CPI对进口的显著的单一影响,
模型3说明:运用方差扩大因子法,计算VIF=1/(1-R^2)=35.7143远远大于10,说明lnGDP与lnCPI之间存在严重的多重共线性。若这两个变量同时引入模型会引起了多重共线性。 (4)如果仅仅是作预测,可以不在意这种多重共线性,但如果是进行结构分析,还是应该引起注意的。
练习题4.4参考答案
本题很灵活,主要应注意以下问题:
(1)选择变量时要有理论支持,即理论预期或假设;变量的数据要足够长,被解释变量与解释变量之间要有因果关系,并高度相关。
(2)建模时尽量使解释变量之间不高度相关,或解释变量的线性组合不高度相关。
练习题4.5参考答案
从模型拟合结果可知,样本观测个数为27,消费模型的判定系数R=0.95,F统计量为107.37,在0.05置信水平下查分子自由度为3,分母自由度为23的F临界值为3.028,计算的F值远大于临界值,表明回归方程是显著的。模型整体拟合程度较高。
依据参数估计量及其标准误,计算各个变量的t统计量值:
2
8.1331.0590.4520.121
=0.912,t1==6.229,t2==0.685,t3==0.111 8.920.170.661.09
除t1外,其余的tj值都很小。工资收入X1的系数的t检验值虽然显著,但该系数的估t0=
计值过大,该值为工资收入对消费边际效应,因为它为1.059,意味着工资收入每增加一美元,消费支出的增长平均将超过一美元,这与经济理论和常识不符。
另外,理论上非工资—非农业收入与农业收入也是消费行为的重要解释变量,但两者的t检验都没有通过。这些迹象表明,模型中存在严重的多重共线性,不同收入部分之间的相互关系,掩盖了各个部分对解释消费行为的单独影响。
练习题4.6参考答案
1)建立多元回归模型为Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+β6X6+β7X7+ui
其中,Y为中国能源消费标准煤总量,X1为国名总收入,X2为国内生产总值,X3为工业增加值,X4为建筑业增加值,X5为交通运输邮电业增加值,X6为人均生活电力消费,
X7为能源加工转换效率。
回归结果为:
Dependent Variable: Y Method: Least Squares Date: 11/17/10 Time: 13:39 Sample: 1985 2007
Included observations: 23
X1 X2 X3 X4 X5 X6 X7 C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 10.68885 -12.43067 0.265643 22.60071 0.874955 909.0161 1444.437 -28023.73
Std. Error 3.034175 3.675319 0.190824 10.19131 2.953978 345.5062 1382.319 94945.12
t-Statistic 3.522820 -3.382201 1.392080 2.217646 0.296195 2.630969 1.044938 -0.295157
Prob. 0.0031 0.0041 0.1842 0.0424 0.7711 0.0189 0.3126 0.7719 139364.6 51705.05 20.61025 21.00520 20.70958 1.316360
0.989801 Mean dependent var 0.985041 S.D. dependent var 6323.831 Akaike info criterion 6.00E+08 Schwarz criterion -229.0178 Hannan-Quinn criter. 207.9591 Durbin-Watson stat 0.000000
从回归结果可以看出,国内生产总值
X2的系数与经济意义矛盾,系数的经济意义为:
X3、X5和X7均不显著;但是可
在其他条件不变的情况下,国内生产总值每增加1个单位,中国能源消费标准煤总量平均减少12.43067个单位;另外从各个变量的t检验可以看出,
绝系数和调整的可绝系数都很高,分别为0.989801和0.985041,说明模型的拟合效果非常好,而F统计量值为207.9591,P值小于0.05,说明各个变量对被解释变量联合显著。 2)如果决定用表中全部变量作为解释变量,会预料到会有多重共线性,因为:从变量的经济意义上看工业增加值、建筑业增加值和交通运输邮电业增加值均是国内生产总值的组成部分,它们之间必然存在某种线性组合,因此必然存在多重共线性。 3)1.模型的变换(差分) 先用差分试试,回归结果如下
Dependent Variable: Y-Y(-1) Method: Least Squares Date: 11/17/10 Time: 14:16 Sample (adjusted): 1986 2007
Included observations: 22 after adjustments
X7-X7(-1) X6-X6(-1) X5-X5(-1) X4-X4(-1)
Coefficient 1603.680 92.39133 1.793205 1.851981
Std. Error 959.3853 368.5883 2.130120 9.928112
t-Statistic 1.671570 0.250663 0.841833 0.186539
Prob. 0.1168 0.8057 0.4140 0.8547
X3-X3(-1) X2-X2(-1) X1-X1(-1)
C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.116616 -10.92141 11.01442 2470.655
0.118745 5.196650 5.081630 2366.093
0.982073 -2.101624 2.167497 1.044192
0.3427 0.0542 0.0479 0.3141 8586.409 8613.515 20.24859 20.64534 20.34205 1.538011
0.751475 Mean dependent var 0.627212 S.D. dependent var 5259.098 Akaike info criterion 3.87E+08 Schwarz criterion -214.7345 Hannan-Quinn criter. 6.047474 Durbin-Watson stat 0.002151
效果非常不好,没有消除多重共线性 2.
1)逐步回归(采用逐步添加变量法) 第一步:
变量 参数估计 t统计量 可绝系数
x1
x2
x3
x4 x5 x6 x7
0.733281 0.735285 1.665481 13.19088 10.89804 678.0058 19332.3 26.46983 25.36274 18.02565 25.96363 13.51473 22.42294 4.702427 0.9709 0.968386 0.939293 0.969789 0.896881 0.959907 0.512906
调整的可决系数 0.969514 0.966881 0.936402 0.96835 0.89197 0.957998 0.489711 从第一步的回归结果看,在各个变量的经济意义和t检验通过的情况下,x1的可绝系数最高,因此保留X1做进一步回归。 第二步:
x1, x2 x1, x3 x1, x4 x1, x5 x1, x6 x1, x7
x1 x2 x3 x4 x5 x6 x7
调整的可绝系数 0.978
6.6398-5.931
(3.511) (-3.123) 0.551 (5.359) 0.504 (0.987) 1.052 (8.77) 1.007 (2.902)
0.435 (1.831)
0.973 0.968 0.977 0.970
4.133 (0.449)
-5.027 (-2.711)
-255.804 (-0.792)
0.750 -813.436
0.968
(17.876) (-0.535)
由此可见,若保留X1,第二步逐步回归将失效,因此我们继续尝试保留其他显著变量。 通过第一步回归我们可以看出,在各个变量的经济意义和t检验通过的情况下,X4是仅次于X1可绝系数最高的变量,因此我们考虑保留X4并做进一步回归,结果如下:
X4 X1 X2 X3 X5 X6 X7
调整的
可绝系数
X4, x1 X4, x2 X4, x3 X4, x5 X4, x6 X4, x7
4.133 0.504
(0.449) (0.987) 10.163 (1.012) 9.696 (5.296) 16.563 (7.531) 13.182 (2.558)
0.968 0.967 0.972 0.970 0.967
0.169 (0.302)
0.464 (1.977)
-2.972 (-1.573)
0.464 (0.002)
13.855 -1769.649
0.969
(17.984) (-1.140)
从回归中可以看出,在X3和X4的回归中,尽管X3的t统计量在0.05的水平下不显著,但是在0.1的水平下显著,且符合经济意义,因此保留X3和X4做进一步回归。
在后面的回归中,无法再引入变量使得模型效果更好,因此采用逐步回归的结果为:
ˆ=80452.14+0.464393X+9.965652X Y34
练习题4.7参考答案
答:模型可能存在多重共线性。
回归结果如下:
Dependent Variable: CS Method: Least Squares Date: 11/19/10 Time: 10:05 Sample: 1978 2007 Included observations: 30
NZ GZ JZZ TPOP CUM SZM C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic
Coefficient -1.907548 0.045947 6.458374 0.096022 0.003108 -0.027627 -5432.507
Std. Error 0.342045 0.042746 0.765767 0.091660 0.042807 0.048904 8607.753
t-Statistic -5.576888 1.074892 8.433867 1.047591 0.072609 -0.564916 -0.631118
Prob. 0.0000 0.2936 0.0000 0.3057 0.9427 0.5776 0.5342 10049.04 12585.51 17.58009 17.90704 17.68468 1.654140
0.989654 Mean dependent var 0.986955 S.D. dependent var 1437.448 Akaike info criterion 47523916 Schwarz criterion -256.7013 Hannan-Quinn criter. 366.6801 Durbin-Watson stat
Prob(F-statistic)
0.000000
拟先采用差分的办法结果如下:
Dependent Variable: CS-CS(-1) Method: Least Squares Date: 11/19/10 Time: 10:08 Sample (adjusted): 1979 2007
Std. Error 0.371971 0.024311 0.984825 1.090000 0.025656 0.034063 1579.506
t-Statistic 0.267883 0.619157 3.333914 -1.516122 0.541159 0.837842 1.264435
Prob. 0.7913 0.5422 0.0030 0.1437 0.5938 0.4111 0.2193 1730.672 2725.660 17.23925 17.56929 17.34261 0.856774
Included observations: 29 after adjustments
NZ-NZ(-1) GZ-GZ(-1) JZZ-JZZ(-1) TPOP-TPOP(-1) CUM-CUM(-1) SZM-SZM(-1)
C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 0.099645 0.015052 3.283320 -1.652573 0.013884 0.028539 1997.183
0.845448 Mean dependent var 0.803298 S.D. dependent var 1208.860 Akaike info criterion 32149561 Schwarz criterion -242.9691 Hannan-Quinn criter. 20.05787 Durbin-Watson stat 0.000000
从回归结果来看,总人口和受灾面积的系数与经济意义相反,且除了建筑业增加值外,其他变量均不显著,说明差分解决不了多重共线性问题,鉴于此将采用逐步回归法。 逐步回归:第一步
变量 t统计量
nz
gz
jzz
tpop
cum
szm 0.11153
参数估计 1.454186 0.417628 3.186851 0.829789 0.332292
12.40398 20.19779 22.67733 6.206025 16.38246 0.320338
可绝系数 0.846034 0.935773 0.948364 0.579041 0.905528 0.003651 从回归结果可以看出,在各个变量的经济意义和t检验通过的情况下,建筑业增加值的可绝系数最高,因此保留jzz做进一步回归。 第二步:
变量 jjz,nz jjz,gz jjz,tpop
nz
gz
jjz
tpop
cum
szm
调整的可绝系数
-1.709 (-9.716)
6.662
(18.302)
0.163 1.984
(2.231) (3.575)
4.086 -0.348
(20.259) (-5.163)
0.988 0.953 0.721
jjz,cum jjz,szm
3.740 (4.834) 3.233 (24.376)
-0.060 (-0.727)
0.946
-0.171
0.954
(-2.279)
从回归结果看,在各个变量的经济意义和t检验通过的情况下,建筑业增加值和受灾面积的的调整的可绝系数最大,因此保留这两个变量进行进一步回归。
但是之后的回归结果均不理想,无法再引入新的变量,因此回归结果为:
CS=6418.238+3.233603JZZ-0.170507SZM