计量实证分析案例
对中国经济增长影响因素的实证分析
本文针对十八大提出的经济增长在2020年翻一番,采用时间序列数据模型和多元线性回归分析方法对1980-2009年(中国统计年鉴数据)三十年间中国经济增长因素进行研究,分析了物质资本、劳动力、消费对国内生产总值(GDP)的影响,建立计量经济学模型,寻求这些变量与国内生产总值的数量关系,进行定量分析,对模型进行检验,最终得出结论。
1.模型的建立
为了具体分析各要素对我国经济增长影响的大小,我们可以用国内生产总值(Y)这
个经济指标作为研究对象;用总就业人员数(X1)衡量劳动力;用固定资产投资总额(X2)衡量资本投入:用价格指数(X3)去衡量消费需求。运用这些数据进行回归分析。这里的被解释变量是Y:国内生产总值,与Y-国内生产总值密切相关的经济因素作为模型可能的解释变量,它们分别为:X1代表社会就业人数,X2代表固定资产投资,X3代表消费价格指数,μ代表随机干扰项。模型的建立大致分为理论模型设置、参数估计、模型检验几个步骤。如果模型符合实际经济理论并且通过各级检验,那么模型就可以作为最终模型,可以进行结构分析和经济预测。
1.1理论模型的确定
通过变量的筛选,最终确定以下变量建立回归模型。被解释变量 Y:国内生产总值, 解释变量:X1:代表社会就业人数,X2:代表固定资产投资,X3:代表消费价格指数,
另外,从经济意义上讲,变量的选择是正确的。而且,就直观上来说,解释变量与被解释变量都是相关的。
表1: 被解释变量与解释变量1980-2009数据
资料来源:《中国统计年鉴》。
首先,检查被解释变量和解释变量之间的线性关系是否成立。观察被解释变量与解释变量之间的散点图。
图1:被解释变量Y与解释变量X1的散点图
由图中趋势线可以判断,被解释变量Y与解释变量X1之间基本呈线性关系。
图2:被解释变量Y与解释变量X2的散点图
由图中趋势线可以判断,被解释变量Y与解释变量X2之间基本呈线性关系。
图3:被解释变量Y与解释变量X3的散点图
由图中趋势线可以判断,被解释变量Y与解释变量X3之间基本呈线性关系。再通过变量之间的相关系数判断。
表2:被解释变量与解释变量相关系数表
Covariance Analysis: Ordinary Date: 12/01/12 Time: 13:05 Sample: 1980 2009 Included observations: 30 Covariance
看到被解释变量Y与解释变量X1,X2,X3之间具有较高的相关性。
通过散点图和相关系数表的判断,可以判断被解释变量和解释变量之间具有明显的相关线性关系。同时通过被解释变量与解释变量的相关图形分析,设置理论模型为:
y=β1+β2X1+β3X2+β4X3+μ
1.2 建立初始模型——OLS 1.2.1 使用OLS法进行参数估计
表3: 普通最小二乘法参数估计输出结果
Dependent Variable: Y Method: Least Squares Date: 12/01/12 Time: 14:23 Sample: 1980 2009 Included observations: 30
X1 X2 X3 C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 1.934840 1.382559 -379.2654 -49822.31
Std. Error 0.215990 0.045823 280.8999 33676.59
t-Statistic 8.957997 30.17169 -1.350180 -1.479434
Prob. 0.0000 0.0000 0.1886 0.1510 85749.31 95692.85 21.27172 21.45855 21.33149 1.178143
0.991233 Mean dependent var 0.990221 S.D. dependent var 9462.951 Akaike info criterion 2.33E+09 Schwarz criterion -315.0758 Hannan-Quinn criter. 979.8468 Durbin-Watson stat 0.000000
得到模型为:
y=-49822.31+1.934840X1+1.382559X2-379.2654X3
1.2.2 对模型进行检验
要对建立的模型进行包括经济意义检验、统计检验、计量经济学检验、预测检验在内的四级检验。 (1)经济意义检验
解释变量的系数分别为β1=1.934840、β2=1.382559。两个解释变量系数均为正,符合被解释变量与解释变量之间的正相关关系,符合解释变量增长带动被解释变
β3=-379.2654,量增长的经济实际,符合被解释变量与解释变量之间的负相关关系。与现实经济意义相符,所以模型通过经济意义检验。 (2)统计检验
①拟合优度检验:R2检验,R-squared=0.991233;Adjusted R-squared=0.990221;可见拟合优度很高,接近于1,方程拟和得很好。
②变量的显著性检验:t检验,
表4:模型系数显著性检验,t检验结果
X1 X2 X3 C
Coefficient 1.934840 1.382559 -379.2654 -49822.31
Std. Error 0.215990 0.045823 280.8999 33676.59
t-Statistic 8.957997 30.17169 -1.350180 -1.47943.
Prob. 0.0000 0.0000 0.1886 0.1510
从检验结果表中看到,包括常数项在内的所有解释变量系数的t检验的伴随概率均小于5%,所以,在5%的显著水平下X1、X2、X3的系数显著不为零,通过显著性检验,常数项也通过显著性检验,保留在模型之中。
③方程的显著性检验:F检验,方程总体显著性检验的伴随概率小于0.00000,在5%显著水平下方程显著成立,具有经济意义。 (3)计量经济学检验:
方程通过经济意义检验和统计检验,下面进行居于计量经济学模型检验核心的计量经济学检验。
①进行异方差性检验:
首先用图示法对模型的异方差性进行一个大致的判断。令X轴为方程被解释变量,Y轴为方程的残差项,做带有回归线的散点图。
图4:模型的异方差性检验散点图
图5:模型的异方差性检验散点图
图6:模型的异方差性检验散点图
通过图形看到,回归线向上倾斜,大致判断存在异方差性,但是,图示法并不准确,下面使用White异方差检验法进行检验,分别选择不带有交叉项和带有交叉项的White异方差检验法。得到下面的检验结果:
表5:不带有交叉项的White异方差检验结果
Heteroskedasticity Test: White F-statistic
75.59849 Prob. F(3,26) 26.91450 Prob. Chi-Square(3) 52.75104 Prob. Chi-Square(3)
Coefficient 1.51E+08 -0.029775 0.017419 -2715.996
Std. Error 1.08E+08 0.009593 0.001245 8243.375
t-Statistic 1.398492 -3.103868 13.98776 -0.329476
0.0000 0.0000 0.0000 Prob. 0.1738 0.0046 0.0000 0.7444 77607780 1.80E+08 38.81668 39.00351 38.87645 1.947056
Obs*R-squared Scaled explained SS
Test Equation:
Dependent Variable: RESID^2 Method: Least Squares Date: 12/01/12 Time: 17:53 Sample: 1980 2009 Included observations: 30
C X1^2 X2^2 X3^2
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.897150 Mean dependent var 0.885283 S.D. dependent var 61075426 Akaike info criterion 9.70E+16 Schwarz criterion -578.2502 Hannan-Quinn criter. 75.59849 Durbin-Watson stat 0.000000
表6:带有交叉项的White异方差检验结果
Heteroskedasticity Test: White F-statistic
33.57944 Prob. F(9,20) 28.13789 Prob. Chi-Square(9) 55.14882 Prob. Chi-Square(9)
0.0000 0.0009 0.0000
Obs*R-squared Scaled explained SS
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares Date: 12/01/12 Time: 17:54 Sample: 1980 2009 Included observations: 30
C X1 X1^2 X1*X2 X1*X3 X2 X2^2 X2*X3 X3 X3^2
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient -2.08E+09 -34576.99 0.189719 -0.297299 127.5161 29147.14 0.033135 -97.11637 55473498 -283697.5
Std. Error 4.06E+09 39720.32 0.224091 0.442472 329.2824 35662.29 0.007760 96.87489 68538734 290382.6
t-Statistic -0.512912 -0.870512 0.846615 -0.671906 0.387254 0.817310 4.270053 -1.002493 0.809374 -0.976978
Prob. 0.6136 0.3943 0.4072 0.5093 0.7027 0.4234 0.0004 0.3281 0.4278 0.3403 77607780 1.80E+08 38.71168 39.17875 38.86110 2.262413
0.937930 Mean dependent var 0.909998 S.D. dependent var 54097636 Akaike info criterion 5.85E+16 Schwarz criterion -570.6752 Hannan-Quinn criter. 33.57944 Durbin-Watson stat 0.000000
使用White检验法不论是否带有交叉项,所得的检验伴随概率均小于5%,均在5%的显著水平下拒绝方程不存在异方差性的原假设,认为模型具有比较严重的异方差性。
②多重共线性检验: 用逐步回归法检验如下
以Y为被解释变量,逐个引入解释变量X1、X2、X3,构成回归模型,进行模型估计。
表7: 被解释变量Y与X1最小二乘估计结果
Dependent Variable: Y Method: Least Squares Date: 12/01/12 Time: 18:32 Sample: 1980 2009 Included observations: 30
X1 C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 6.692086 -334986.1
Std. Error 0.880526 56283.70
t-Statistic 7.600101 -5.951743
Prob. 0.0000 0.0000 85749.31 95692.85 24.75574 24.84915 24.78562 0.096883
0.663513 Mean dependent var 0.661853 S.D. dependent var 55645.78 Akaike info criterion 8.67E+10 Schwarz criterion -369.3361 Hannan-Quinn criter. 57.76153 Durbin-Watson stat 0.000000
表8: 被解释变量Y与X2最小二乘估计结果
Dependent Variable: Y Method: Least Squares Date: 12/01/12 Time: 18:34 Sample: 1980 2009 Included observations: 30
X2 C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 1.688594 19746.45
Std. Error 0.063011 4234.328
t-Statistic 26.79831 4.663420
Prob. 0.0000 0.0001 85749.31 95692.85 22.59239 22.68580 22.62227 0.402624
0.962474 Mean dependent var 0.961134 S.D. dependent var 18865.38 Akaike info criterion 9.97E+09 Schwarz criterion -336.8858 Hannan-Quinn criter. 718.1495 Durbin-Watson stat 0.000000
表9: 被解释变量Y与X3最小二乘估计结果
Dependent Variable: Y Method: Least Squares Date: 12/01/12 Time: 18:36 Sample: 1980 2009 Included observations: 30
Coefficient
Std. Error
t-Statistic
Prob.
X3 C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
-4733.789 586426.4
2602.669 275788.7
-1.818821 2.126361
0.0797 0.0424 85749.31 95692.85 25.76343 25.85685 25.79332 0.120717
0.105663 Mean dependent var 0.073722 S.D. dependent var 92097.98 Akaike info criterion 2.37E+11 Schwarz criterion -384.4515 Hannan-Quinn criter. 3.308109 Durbin-Watson stat 0.079650
由图可以看出,Y与X2的拟合优度是最大的,R-squared=0.962474。再做
Y与X1和X2的回归模型。
表10: 被解释变量Y与X1和X2的最小二乘估计结果
Dependent Variable: Y Method: Least Squares Date: 12/01/12 Time: 18:47 Sample: 1980 2009 Included observations: 30
X1 X2 C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 1.963607 1.391253 -92084.42
Std. Error 0.218188 0.046055 12611.85
t-Statistic 8.999617 30.20878 -7.301423
Prob. 0.0000 0.0000 0.0000 85749.31 95692.85 21.27282 21.41294 21.31765 0.956357
0.990618 Mean dependent var 0.989923 S.D. dependent var 9606.088 Akaike info criterion 2.49E+09 Schwarz criterion -316.0923 Hannan-Quinn criter. 1425.411 Durbin-Watson stat 0.000000
再做Y与X1和X2、X3的回归模型。
表11: 被解释变量Y与X1和X2、X3的最小二乘估计结果
Dependent Variable: Y Method: Least Squares Date: 12/01/12 Time: 18:51 Sample: 1980 2009 Included observations: 30
X1 X2 X3 C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 1.934840 1.382559 -379.2654 -49822.31
Std. Error 0.215990 0.045823 280.8999 33676.59
t-Statistic 8.957997 30.17169 -1.350180 -1.479434
Prob. 0.0000 0.0000 0.1886 0.1510 85749.31 95692.85 21.27172 21.45855 21.33149 1.178143
0.991233 Mean dependent var 0.990221 S.D. dependent var 9462.951 Akaike info criterion 2.33E+09 Schwarz criterion -315.0758 Hannan-Quinn criter. 979.8468 Durbin-Watson stat 0.000000
观察Y与X1和X2最小二乘估计的拟合优度(R-squared =0.990618),与
Y与X1最小二乘估计的拟合优度(R-squared =0.673513)比较,变化明显,说明X1对y的影响显著。观察Y与X1和X2、X3最小二乘估计的拟合优度(R-squared =0.991233),Y与X1和X2最小二乘估计的拟合优度(R-squared =0.990618)比较,变化不明显,说明X3对y影响不显著。 (4)预测检验
图9:模型预测检验结果图
预测误差MAPE=28.52734%,MAPE大于10,预测效果。 通过参数估计和四级检验,得到的模型是:
ˆ=-49822.31+1.934840X1+1.382559X2-379.2654X3 y
t=(-1.479434)(8.957997)(30.17169)(-1.350180) p=(0.1510) (0.0000) (0.0000) (0.1886)
R-squared=0.991233 Adjusted R-squared=0.990221
2.模型经济意义分析
通过对最初的使用普通最小二乘估计参数得到的模型进行加权修正,得到的使用加权最小二乘法估计参数的模型是:
ˆ=-43825.71+1.708496X1+1.574969X2-332.6186X3 y
t=(-19.42702)(22.48069)(27.00773) (-23.92532) p=(0.0000)(0.0000)(0.0000)(0.0000) R2=0.999841
2
=0.999823 D.W.= 1.083337
3.结论
1、固定资产投资是经济增长的重要原动力。
经济发展取决于投入资金的数量和资金的利用效率。固定资产投资是经济增长的重要原动力,它对经济运行具有先导作用,并以其乘数效应拉动经济增长。
2、劳动力对GDP有一定的促进作用但对经济增长的贡献率却微不足道。 这是因为我国劳动力结构总量巨大、供给充足、流动性强, 对GDP 影响很大。但是劳动力的人力资本含量、高技术含量偏低,劳动力素质结构存在严重缺陷, 会直接影响了经济的增长。
3、消费需求对经济的拉动作用
消费需求是三大需求要素中所占份额最大、波动幅度最小的部分,是国民经济的重要支柱和最主要的组成部分,同时也是明显地反映经济自发增长态势的宏观经济指标。