统计学实验
一、一元回归分析
实例分析(2):
选取中国1978~2002年中国研究经费与中国GDP之间的数量关系,建立的一元回归模型如下:
yi=α+βxi+εi
其中,yi是中国GDP,xi是中国研究经费 线性回归分析的基本步骤及结果分析:
①绘制散点图
图1
②简单相关分析
表1
分析:从表1中可得到两变量之间的皮尔逊相关系数为0.928,双尾检验概率p值尾0.000
在此前提下进一步进行回归分析,建立一元线性回归方程。 ③线性回归分析
(1)表2给出了回归模型的拟和优度(R Square)、调整的拟和优度(Adjusted R Square)、估计标准差(Std. Error of the Estimate)以及Durbin-Watson
统计量。
从结果来看,回归的可决系数和调整的可决系数分别为0.860和0.854,即GDP的85%以上的变动都可以被该模型所解释,拟和优度较高。
表2
p值为0,所以,拒绝模型整体不显著的原假设,即该模型的整体是显著的。
(2)表3给出了回归模型的方差分析表,可以看到,F统计量为141.616,对应的
表3
(3)表4给出了回归系数、回归系数的标准差、标准化的回归系数值以及各个回归系数的显著性t检验。从表中可以看到无论是常数项还是解释变量x,其t统计量对应的p值都小于显著性水平0.05,因此,在0.05的显著性水平下都通过了t检验。变量US经费的回归系数为0.090,即US经费每增加1百万美元,
USGDP
就增加0.090个十亿美元。
表4
(4)为了判断随机扰动项是否服从正态分布,观察图2所示的标准化残差的P
-P图,可以发现,各观测的散点基本上都分布在对角线上,据此可以初步判断残差服从正态分布。
为了判断随机扰动项是否存在异方差,根据被解释变量y与解释变量x的散点图,如图1所示,从图1中可以看到,随着解释变量x的增大,被解释变量y的波动幅度明显增大,说明随机扰动项可能存在比较严重的异方差问题,应该利用加权最小二乘法等方法对模型进行修正。
图
2
二、多元回归分析
表5给出了Pearson简单相关系数,相关检验t统计量对应的p值。相关系数右上角有两个星号表示相关系数在0.01的显著性水平下显著。从表中可以看出,3个指标之间的相关系数都在0.8以上,对应的p值都接近0,表示3个指标具有较强的正相关关系,而托宾Q值与其他3个变量之间的相关性较弱。
表5
案例分析(4):
选取美国1978~2002年US研究经费与研究人员与GDP之间的数量关系,建立的多元回归模型如下:
ˆ0+βˆˆyi=β1xi1+β2x+ei 其中,Y是中国GDP,
Xi1是中国研究经费, Xi2是中国研究人员
线性回归分析的基本步骤及结果分析:
①简单相关分析
从表6中可得到
USGDP与US经费的皮尔逊相关系数为0.977,双尾检验概率p值尾0.000
表6
②线性回归分析
(1)表7给出了回归模型的拟和优度(R Square)、调整的拟和优度(Adjusted R Square)、估计标准差(Std. Error of the Estimate)以及Durbin-Watson统计量。从结果来看,回归的可决系数和调整的可决系数分别为0.982和0.981,即GDP的98%以上的变动都可以被该模型所解释,拟和优度较高。
表7
(2)表8给出了回归模型的方差分析表,可以看到,F统计量为610.725,对
应的p值为0,所以,拒绝模型整体不显著的原假设,即该模型的整体是显著的。
表8
(3)表9给出了回归系数、回归系数的标准差、标准化的回归系数值以及各个回归系数的显著性t检验。从表中可以看到无论是常数项还是解释变量x,其t统计量对应的p值都小于显著性水平0.05,因此,在0.05的显著性水平下都通过了t检验。
变量US人数的回归系数为6.395,即US人数每增加1人,USGDP就增加6.395个十亿美元。变量US经费(百万美元)的回归系数为-0.001,及US经费每增加一百万美元,USGDP就增加十亿美元。
表9
10.13
各季度季节指数如下:
根据分离后的季节因素后的数据计算的趋势方程为: Yt=2043.392+163.7064t