时间序列模型实际应用
时间序列模型案例分析
___原创:于南京财经大学就读期间
摘要:本文通过对一简单的时间序列实例建立了两种基本的预测模型,并对模型的拟合
优度进行了比较。特别地,在一次线性预测模型中,对折扣系数α的选取提出了个人建议。
案例
某零售商店1994—2002年销售额如下:
年份 1994 1995 1996 1997 1998 1999 2000 2001 2002
销售额(万元)
52
54
58
61
64
67
71
74
77
要求:选择合适的预测模型,预测2003和2004年的销售额及预测区间(α
首先作散点图如下:
=0.05)
• •
一.线性二次移动平均法
从散点图可以看出时间序列具有直线趋势,可认为未来时期亦按此直线趋势变化,设直线趋势预测模型为:^yt+T =at+btT
对案例实行线性二次移动平均法,取N=3:
(1)(2)
年份 t 销售额(万元) yt Mt Mt
1994 1 52 _
1995 2 54 _
1996 3 58 54.66667
1997 4 61 57.66667
1998 5 64 61 57.77778 1999 6 67 64 60.88889
2000 7 71 67.33333 64.11111
2001 8 74 70.66667 67.33333
2002 9 77 74 70.66667
2003 10 _ _ _
2004 11 _
_ _
•
•
一次移动平均公式:Mt(1)= yt+ yt+1 +yt+2 / 3
二次移动平均公式:Mt(2)= Mt(1) + Mt+1(1)+ Mt+2(1)/ 3 预测模型为:^yt+T =at+btT
估计t=9时的参数:a9= 2M9(1)- M9(2)=2×74-70.66667=77.3333
b9= 2(M9(1)- M9(2))/N-1=2(74-70.66667)/3-1=3.3333
得t=9时的预测模型为:^y9+T =77.3333+3.3333T 预测2003与2004年的销售额为
^
y2003=^y10=^y9+1=77.3333+3.3333×1=80.6666 ^
y2004=^y11=^y9+2=77.3333+3.3333×2=83.9999
• • •
二.一次线性预测模型
散点图呈直线趋势,又因为时间序列的一阶差分近似为一常数,说明该时间序列的数据点在较长时间内呈现连续不断地增长或减少的变化趋势,且逐期增减量大致相同,所以可以运用趋势外推法中的一次(线性)预测模型进行预测.(课本81页仅做了简略说明,此处以上例作详细说明)
•
拟和一次(线性)预测模型^yt =a+bt
•
•
(一):最小平方法:
最小平方法(最小二乘法)就是使误差平方和Q=∑(yt-^yt)2 ,既Q=∑(yt-a-bt)2 达到最小来估计a和b的方法。
• 由极值原理,有:dQ/da=-2∑(yt―a―bt)=0 • dQ/db=-2∑(yt―a―bt)t=0 • 可得标准方程组: ∑yt=na+b∑t
2
• ∑tyt=a ∑t +b∑t
• (其中n为时间序列的项数.) • 为了简化计算,可选取时间序列{yt}的中点为时间原点,使∑t=0 则上方程组简化为:
• ∑yt =na
2 •
∑tyt =b ∑t
•
由此可得:
•
•
^a=∑yt/n ^b=∑tyt/∑t2
•
针对此题最小平方法如下:
年份 t 销售额(万元) yt ty t2 ^yt (yt-^yt)2 1994 -4 52 -208 16 51.42 0.3364 1995 -3 54 -162 9 54.62 0.3844 1996 -2 58 -116 4 57.82 0.0324 1997 -1 61 -61 1 61.02 0.0004 1998 0 64 0 0 64.22 0.0484 1999 1 67 67 1 67.42 0.1764
2000 2001 2002 合计 •
• • • • • • • • • • •
2 3 4 0 71 74 77 578 142 4 70.62 222 9 73.82 308 16 77.02 192 60 578 0.1444
0.0324 0.0004 1.1556
估计参数:
a=∑yt/n=578/9=64.22 b=∑tyt/∑t2=192/60=3.20
所求预测模型为: ^yt=64.22+3.20t 预测: ^y2003=64.22+3.20×5=80.22(万元) ^y2004=64.22+3.20×6=83.42(万元)
估计标准差为:sy=0.4063 查表:t0.025(9-2)=2.36 根据预测区间的计算公式得:
2003年预测区间为:(79.03,81.41) 2004年预测区间为:(82.17,84.67)
(二).折扣最小平方法
最小平方法是估计线性模型参数的常用方法,但也有缺陷,就是把近期误差与远期误差的重要性等同看待.实际上,近期误差比远期误差重要的多.为了克服这个缺陷,常采用折扣最小平方法,进行合理的加权,对近期误差比对远期误差给以较大的权数.
折扣最小平方法就是对误差平方进行指数折扣加权后,使其总和达到最小的方法 .即: Q=∑αn-t(yt-^yt)2=min
(式中:α称为折扣系数,0
由上式可以看出, 最近期的误差平方(yn-^yn)2的权数为α0 最远期的误差平方(y1-^y1)2的权数为αn-1.第t期的误差平方的权数为αn-t.由于 α0=1,…, αn-t,... αn-1是越来越小的权数,这说明对最近期的误差平方不打折扣,而对最远期的误差平方,越远打折扣越大.所以称为折扣最小平方法.折扣的程度视α取值大小而异, α值越接近0,折扣加权作用越大; α值越接近1,折扣加权作用越小.如α=1则为最小平方法.
^
• • • •
现在用折扣最小平方法来估计模型
• • • • •
yt =a+bt的参数a.b,
使
Q=∑ αn-t(yt-a-bt)2=min
对上式求偏导数,得参数a,b估计值的标准方程组为:
∑ αn-tyt= α∑ αn-t+b ∑ αn-tt ∑ αn-ttyt= α∑ αn-tt+b ∑ αn-tt2
•
对案例实行折扣最小平方法:α=0.8
n-t
n-t αn-t α年份 t 销售额(万元)
yt
1994 1 52 8 0.168 1995 2 54 7 0.21 1996 3 58 6 0.262 1997 4 61 5 0.328 1998 5 64 4 0.41 1999 6 67 3 0.512 2000 7 71 2 0.64 2001 8 74 1 0.8 2002 9 77 0 1
yt α
n-t
tyt α
n-t
t α
n-t
t2 ^yt 51.34
54.56 57.77 60.99 64.21 67.43 70.65 73.87 77.08
8.7256 11.3238 15.2018 19.9897 26.2144 34.304 45.44 59.2 77 8.7256 22.6476 45.6054 79.9588 131.072 205.824 318.08 473.6 693 0.1678 0.4194 0.7863 1.3108 2.048 3.072 4.48 6.4 9 0.1678 0.8388 2.3589 5.2432 10.24 18.432 31.36 51.2 81
合计 578 4.329 297.3993 1978.5134 27.684 200.841
将计算结果代入标准方程,得:
297.3993=4.3289a+27.6843b 1978.5134=27.6843a+200.8407b 得:
^a=48.1185 ^b=3.2184
得所求预测模型为: ^yt=48.1185+3.2184t
预测: ^y2003=48.1185+3.2184×10=80.3025(万元) ^y2004=48.1185+3.2184×11=83.5209(万元) 估计标准误差Sy=0.2280 查表:t0.025(9-2)=2.36
-n-tn-t
t=∑αt/∑α=27.6843/4.3289=6.3952 根据预测区间公式得预测区间如下: 2003年为(79.61,80.99) 2004年为(82.76,84.28)
577
(三).方法比较:
•
以上用两种方法对模型进行了预测,然而哪一种方法更精确呢?把两种方法所得的追溯预
测值进行比较,可以看出,折扣最小平方法(α=0.8)最近期的追溯值^y2002 =542.61,要比最小平方法(α=1) 最近期的追溯值^y2002 =543.48,更接近实际观测值y2002 =541,而且这种情况随α取值越小越突出.这是因为α取值越小,对近期的权数就显得越大,因而预测值就越接近实际观测值,预测区间的幅度也较小.这就是折扣最小平方法的作用.
• (四).本人对α值的选取建议:
• 如何选取合适的折扣系数α,一般可利用计算机,在0__1范围内,选取若干α值进行试算,
使Q=∑αn-t(yt-^yt)2达到最小的那个α为最好,但是这种随机性的取值方法,难以快速的找到最精确的α值;在此本人借鉴一些数学大师的建模经验,个人认为可以利用黄金分割法选取最优的α值。(注:查Mathematica系统函数表得GoldenRatio(黄金分割点)ψ=(√5-1)/2≈0.61803)
•
具体方法如下:
在0-1间的黄金分割点ψ1处取α1=ψ1,得到进行指数折扣加权后的误差平方Q1 ,在0-ψ1间的黄金分割点ψ2处取α2=ψ2,得到进行指数折扣加权后的误差平方Q2 在ψ1-1间的黄金分割点ψ3处取α3=ψ3,得到进行指数折扣加权后的误差平方Q3 比较Q1 Q2 Q3 三个的值,(1)若Q1最小,则α1=ψ1既是最优折扣系数α (2)若Q2最小,则最优折扣系数α必在0-ψ1之间。此时在0-ψ1间重复上述步骤,重复操作即可快速找到精确的最优折扣系数α 。(α值的试验值的优劣比较也可以利用最近期的追溯预测值与实际观测值的接近程度判别)。