时间序列论文
时间序列分析 期末课程论文
实验名称:青海省谷物产量时间序列分析 姓 名:白茹梦 刘瑞松 张韦维 学 号: 802092204 802092224 802092233 班 级: 08级统计(二)班 指导教师:时 间: 二○一一 年 七月
青海省谷物产量时间序列分析
一、 经济理论背景
时间序列,也叫时间数列、历史复数或动态数列。它是将某种统计指标的数值,按时间先后顺序排列所形成的数列。时间序列预测法就是通过编制和分析时间序列,根据时间序列所反映出来的发展过程、方向和趋势,建立数学模型,进行类推或延伸,借以预测下一段时间或以后若干年内可能达到的水平。其内容包括:收集与整理某种社会现象的历史资料;对这些资料进行检查鉴别,排成数列;分析时间数列,从中寻找该社会现象随时间变化而变化的规律,得出一定的模式;以此模式去预测该社会现象将来的情况。
二、 指标选取与数据收集
从1997年到2007年10年间,世界谷物利用量从约18.5亿吨上升到20.66亿吨,年均复合增长约1.11%。增长速度不快,但表现出较强的刚性。全球谷物的产量波动较大,围绕利用量大幅波动。2002年产量低于利用量约1亿吨,达到了最大。随后的产量触底回升,2007年的产量和利用量基本平衡。本文以青海省近年来的谷物产量为例预测其未来发展趋势,时间序列数据如下表:
(单位:千吨)
(数据来源:中国统计局)
三、 实验过程 (一) 序列预处理
1、 平稳性检验
1.81.61.41.21.00.80.60.4
0.2
图1为序列时序图,由图看出该序列始终在一个常数值附近随即波动,而且波动的范围有界,没有明显的趋势性和周期性,满足平稳序列图形要求,因此我们可以初步认为该序列是平稳序列,为更进一步检验是否平稳,我们用单位根检验,如下表是单位检验结果截取的一部分,由表可以认为该序列在95%置信度下是平稳的。
ADF Test Statistic
-3.427274 1% Critical Value*
5% Critical Value 10% Critical Value
-3.5253 -2.9029 -2.5886 *MacKinnon critical values for rejection of hypothesis of a unit root.
2、 纯随机性检验
纯随机序列各项之间没有任何关联,序列在进行完全无序的随机波动,一旦某个随机事件呈现出纯随机运动的特征,就认为该随机事件没有包含任何值得提取的有用信息,就该终止分析,所以我们一般只对平稳非纯随机序列进行分析,下图为样本自相关图,图中p值均小于α,因此可以认为该序列是非纯随机序列。
Date: 06/24/11 Time: 15:34 Sample: 1 73
Included observations: 73 Autocorrelation . |** | . |*. | . |*. | . |** | . |** | . |*. | . | . | . |*. | . |*. | . |** | . | . | .*| . | . | . | . | . | .*| . | .*| . | .*| . | .*| . | **| . | . | . | .*| . | .*| . | .*| . |
Partial Correlation . |** | . |*. | . |*. | . |*. | . |*. | . | . | .*| . | . | . | . |*. | . |*. | .*| . | .*| . | .*| . | .*| . | .*| . | .*| . | . | . | . | . | **| . | . |*. | . | . | . |*. | . | . |
AC PAC Q-Stat Prob 1 0.284 0.284 6.1164 0.013 2 0.188 0.117 8.8523 0.012 3 0.178 0.108 11.335 0.010 4 0.252 0.181 16.380 0.003 5 0.269 0.159 22.215 0.000 6 0.195 0.055 25.327 0.000 7 0.043 -0.105 25.481 0.001 8 0.104 0.019 26.391 0.001 9 0.181 0.085 29.202 0.001 10 0.247 0.142 34.492 0.000 11 0.051 -0.093 34.718 0.000 12 -0.083 -0.174 35.342 0.000 13 -0.046 -0.089 35.535 0.001 14 -0.017 -0.088 35.562 0.001 15 -0.066 -0.110 35.975 0.002 16 -0.114 -0.061 37.215 0.002 17 -0.100 0.043 38.201 0.002 18 -0.081 0.007 38.847 0.003 19 -0.204 -0.217 43.079 0.001 20 -0.032 0.095 43.187 0.002 21 -0.140 -0.009 45.262 0.002 22 -0.066 0.125 45.724 0.002 23 -0.127 -0.023 47.478 0.002
.*| . | .*| . | . | . | . | . | . | . | .*| . | . |*. | . |*. | . |*. |
. |*. | . | . | . |*. | . | . | . | . | . | . | . |*. | . |*. | . |*. |
24 -0.067 0.078 47.975 0.003 25 -0.145 -0.057 50.370 0.002 26 -0.006 0.081 50.375 0.003 27 -0.012 0.038 50.391 0.004 28 -0.051 -0.018 50.707 0.005 29 -0.118 -0.038 52.426 0.005 30 0.077 0.126 53.180 0.006 31 0.112 0.072 54.805 0.005 32 0.129 0.070 57.044 0.004
二、建立模型
(一)模型的确定与检验
由自相关图的自相关系数与偏自相关系数的特点,二者均在延迟一阶后落入2倍标准差内且变化都不大,没有明显的衰减至零现象,我们可以分别拟合AR(1)与MA(1)模型,首先对AR(1)模型进行分析如下表
Dependent Variable: X Method: Least Squares Date: 06/24/11 Time: 15:38 Sample(adjusted): 2 73
Included observations: 72 after adjusting endpoints Variable C R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Inverted AR Roots
Coefficient 0.879675 Std. Error 0.047141 t-Statistic 18.66031 Prob. 0.0000 0.296447 0.363483 0.426724 6.148602 0.015562
0.080745 Mean dependent var 0.880833 0.067613 S.D. dependent var 0.286250 Akaike info criterion 5.735739 Schwarz criterion -11.08539 F-statistic 2.016295 Prob(F-statistic) .28
表中参数的t统计量绝对值都大于2,p值都小于α,参数都很显著且通过检验,然后需对方程做残差序列,对残差序列进行纯随机性检验,如果残差项是纯随机序列,则表明残差项中已再无可提取的有用信息,则表明AR(1)模型是显著的,能对该时间序列进行分析说明,检验结果如下:
Date: 06/24/11 Time: 20:32 Sample: 1 73
Included observations: 72
Autocorrelation . | . | . |*. | . |*. | . |*. | . |*. | . |*. | . | . | . | . | . |*. | . |** | . | . | .*| . | . | . | . | . | . | . | .*| . | .*| . | . | . | **| . | . | . | .*| . | . | . | .*| . | . | . | .*| . | . | . | . | . | . | . | .*| . | . |*. | . |*. | Partial Correlation . | . | . |*. | . |*. | . |*. | . |*. | . |*. | .*| . | . | . | . | . | . |*. | . | . | .*| . | .*| . | .*| . | .*| . | .*| . | . | . | . |*. | **| . | . | . | . | . | . |*. | . | . | . |*. | . | . | . | . | . | . | . | . | .*| . | . |*. | . |*. | AC PAC Q-Stat Prob
1 -0.027 -0.027 0.0531 0.818 2 0.067 0.066 0.3897 0.823 3 0.071 0.075 0.7843 0.853 4 0.152 0.153 2.5940 0.628 5 0.173 0.180 4.9842 0.418 6 0.129 0.132 6.3234 0.388 7 -0.047 -0.074 6.5058 0.482 8 0.056 -0.014 6.7714 0.561 9 0.106 0.046 7.7267 0.562 10 0.217 0.180 11.784 0.300 11 0.002 -0.001 11.785 0.380 12 -0.101 -0.147 12.698 0.391 13 -0.021 -0.099 12.737 0.468 14 0.009 -0.090 12.745 0.547 15 -0.042 -0.118 12.908 0.609 16 -0.086 -0.108 13.619 0.627 17 -0.063 0.003 14.002 0.667 18 0.006 0.069 14.006 0.729 19 -0.201 -0.219 18.056 0.519 20 0.062 0.039 18.444 0.558 21 -0.135 -0.039 20.347 0.499 22 0.002 0.118 20.348 0.561 23 -0.098 -0.009 21.393 0.557 24 0.006 0.095 21.396 0.615 25 -0.150 -0.053 23.932 0.523 26 0.043 0.062 24.145 0.568 27 0.005 0.059 24.148 0.622 28 -0.017 0.005 24.182 0.672 29 -0.143 -0.073 26.704 0.588 30 0.092 0.084 27.783 0.582 31 0.073 0.081 28.470 0.597 该结果表明p值均大于α,属于纯随机序列,则AR(1)模型是显著的,以同样的方法可得MA(1)模型的参数检验与模型检验结果如下表:
Dependent Variable: X Method: Least Squares Date: 06/24/11 Time: 15:35 Sample: 1 73
Included observations: 73
Convergence achieved after 6 iterations Backcast: 0
C
0.882298
0.041419
21.30177
0.0000
MA(1)
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.236623 0.115126 2.055336 0.0435
0.065224 Mean dependent var 0.882055 0.052058 S.D. dependent var 0.286797 Akaike info criterion 5.839910 Schwarz criterion -11.39285 F-statistic 1.940718 Prob(F-statistic) 0.294566 0.366928 0.429680 4.954052 0.029206
Date: 06/24/11 Time: 20:36 Sample: 1 73
Autocorrelation . | . | . |*. | . |*. | . |*. | . |*. | . |*. | . | . | . |*. | . |*. | . |** | . | . | .*| . | . | . | . | . | . | . | .*| . | .*| . | . | . | **| . | . | . | .*| . | . | . | .*| . | . | . | .*| . | . | . | . | . | . | . | .*| . | . |*. | . | . | Partial Correlation . | . | . |*. | . |*. | . |*. | . |*. | . |*. | .*| . | . | . | . | . | . |*. | . | . | .*| . | .*| . | .*| . | .*| . | .*| . | . | . | . |*. | **| . | . | . | . | . | . |*. | . | . | . |*. | . | . | . | . | . | . | . | . | .*| . | . |*. | . |*. |
AC PAC Q-Stat Prob
1 0.029 0.029 0.0619 0.804 2 0.161 0.160 2.0533 0.358 3 0.102 0.096 2.8690 0.412 4 0.188 0.165 5.6683 0.225 5 0.195 0.174 8.7445 0.120 6 0.156 0.112 10.720 0.097 7 -0.011 -0.090 10.730 0.151 8 0.083 -0.016 11.309 0.185 9 0.117 0.053 12.483 0.187 10 0.221 0.168 16.709 0.081 11 0.019 -0.021 16.741 0.116 12 -0.082 -0.170 17.350 0.137 13 -0.027 -0.109 17.419 0.181 14 -0.001 -0.084 17.419 0.235 15 -0.047 -0.110 17.631 0.283 16 -0.088 -0.090 18.375 0.302 17 -0.081 0.009 19.017 0.328 18 -0.013 0.072 19.035 0.390 19 -0.213 -0.225 23.643 0.210 20 0.048 0.049 23.882 0.248 21 -0.152 -0.016 26.319 0.195 22 -0.005 0.127 26.321 0.238 23 -0.125 -0.014 28.034 0.214 24 -0.004 0.087 28.037 0.259 25 -0.154 -0.052 30.741 0.198 26 0.032 0.057 30.860 0.234 27 -0.016 0.055 30.891 0.276 28 -0.017 0.006 30.925 0.320 29 -0.135 -0.066 33.201 0.270 30 0.094 0.098 34.331 0.268 31 0.063 0.076 34.845 0.290
由上述检验结果同样得出MA(1)是显著的。
(二) 模型优化
对于两个模型或两个以上模型都能通过检验时,我们需要从中选择一个最优的对观察值序列进行拟合,这就是模型优化,根据所有通过检验的模型中使得AIC或SBC函数达到最小的模型为相对最优模型,我们可以看出AR(1)模型的Akaike info criterion和Schwarz criterion值都最小,所以最后选用AR(1)模型作为青海省谷物产量研究的数学模型,即:
Xt=0.88+0.28xt-1+ε
t
三、预测
通过以上各步骤,我们的最终目的是要利用这个拟合模型对随即序列的未来发展进行预测,所谓预测就是利用序列已观察到的样本值对序列在未来某个时刻的取值进行估计,如赋予xt-1的一个值,在考虑其它影响因素的情况下可大致知道Xt的值,从而观察序列变化趋势,同样我们可以利用Eviews做推迟五期或一期的预测图如下:
1.61.41.21.0
0.80.60.40.274
75
76
77
78
左图为推迟五期预测图,可知未来青海省的谷物产量都比较平稳,控制在0.8千吨以上,右图为推迟一期的预测图,能得到同样结果,一般做只预测一期比较准确。
四、 政策化建议
经过分析近年来青海省谷物产量,知道其产量虽然比较稳定,没有太大起伏波动,但是总体来说太低,如今就是因为谷物需求大于供给,才使得粮食价格逐渐上涨,而作为一个地区,粮食价格上涨更明显,且会降低人们的生活水平,因此青海省应该提高谷物产量,比如靠政府补贴,提高农业技术水平,运用先进的机器设备务农,提高农民的文化程度,逐步改善现状,满足大众对粮食的需求,从而在本地区内控制物价上涨,就全国范围来看也是十分有意义的。