灰色组合预测模型及其应用
第17卷 第5期中国管理科学Vol.17,No.5
文章编号:1003-207(2009)05-0150-06
灰色组合预测模型及其应用
曾 波,刘思峰,方志耕,谢乃明
(南京航空航天大学经济与管理学院,江苏南京 210016)
摘 要:针对传统回归模型需要的数据量大且建模复杂等缺陷,提出了一种基于灰色关联度和GM(1,1)的灰色组合预测模型;从灰色关联度的视角寻找数据之间的依赖关系,运用GM(1,1)模型预测数据关系的未来发展趋势,进而建立因变量的预测模型;模型体现了回归分析基于事物因果关系的建模思想,同时又具有灰色理论小样本建模的特点;应用该模型对我国2007和2008年度的GDP进行预测,预测结果表明了该模型的有效性及实用性。关键词:预测技术;组合预测模型;灰色关联度;回归分析;GM(1,1)模型中图分类号:N945124;C931 文献标识码:A
1 引言
在以往的研究中,多因素的统计分析常采用相关与回归的方法,回归分析用来研究一个变量(因变量)与另一个或多个变量(自变量)之间的关系,其主要思想是根据事物之间的因果关系去寻找数据变化的规律性,从而建立因变量的预测模型,实现对未知数据的预测。实践证明,在满足建模要求的情况下,回归模型通常具有较高的预测精度。但是,在进行回归分析时,要求样本量足够大且必须呈典型分布,计算过程复杂,特别是在处理多自变量,且这些自变量与因变量关系非线性的时候,模型的构造十分困难。
对于小样本预测,目前主要的方法有马尔可夫模型及灰色预测模型。虽然马尔可夫模型需要的数据量小,但是计算的准确率偏低而存储复杂度偏高[1-3]。灰色预测模型主要通过对原始数据的累加生成序列建立指数模型来实现数据预测,其中GM(1,1)模型是基础和核心
[4]
行变换,以增加离散数据的光滑度
[5-7]
;(2)改进
GM(1,1)模型中参数的计算方法及优化背景值的构造[8-10];(3)对模型残差的修正[11];(4)对建模方式进行改进,并提出了扩展的GM(1,1)模型[12];(5)对GM(1,1)模型实用条件进行研究[13]。虽然这些优化措施在一定程度上提高了模型的预测精度,但无法从本质上改变灰色模型仅从序列本身寻找数据变化规律进行预测这一特点,这与回归模型存在本质上的区别。
灰色关联度是对序列之间关系紧密程度的量化,这种紧密程度在几何上体现为数据序列所对应曲线的相似程度(距离的相近性或者变化率的相似性),在映射上表现为组成序列的数据之间满足一定的函数关系,当某一序列改变时,另一序列会在灰色关联度的约束下发生相应的变化,其中蕴含了数据变化的依赖关系,通过这种关系建立模型从而实现对未知数据的预测,反映了回归分析中从事物因果关系出发进行预测的基本观点,体现了预测模型的/回归0特性。
本文通过灰色关联度建立序列之间的函数关系,运用GM(1,1)模型对序列间关系的发展趋势进行预测。由于模型中同时包含灰色关联度及GM(1,1)模型,故称之为灰色组合预测模型。该模型通过灰色关联度建立数据变化的函数依赖关系,规避了多元回归分析中因变量与自变量间关系复杂建模难度大的缺陷;另一方面,运用回归分析基于事物因果关系的建模思想构建预测模型,改变了传统灰色模型仅从数据本身寻找规律进行预测的不足。
1),但众多学者在应用
该模型时,发现模型的预测精度不稳定,并为此做了大量的研究,主要集中在:(1)对建模的原始序列进
收稿日期:2009-02-05;修订日期:2009-09-15
基金项目:国家自然科学基金资助项目(70701017,709010141,
70971064,90924022);教育部博士点科研基金([1**********]0);江苏高等学校优秀创新团队(P0702);南京航空航天大学创新群体(Y0553);特聘教授科研创新基金(1009-260812)
作者简介:曾波(1975-),男(汉族),四川威远人,南京航空航天
大学博士研究生,讲师,研究方向:灰色系统理论、复杂模型的软件实现.
第5期 曾 波等:灰色组合预测模型及其应用#151#
式进行模型的构建,因此建模容易,而传统的回归模型需要考虑自变量与因变量之间复杂的函数关系,模型的构建难度较大;其次,灰色组合模型都属/灰色建模0,具有灰色理论小样本建模的优点;第三,模型主要涉及到的都是初等运算,计算过程简单;第四,模型的构建源于事物之间因果关系,体现了预测模型的/回归0特性,具有传统回归模型预测精度较高的优点。
灰色组合预测模型是灰色系统理论对小样本数据在预测手段上的丰富和升华,具有重要的理论价值和实用价值。应用分析表明该模型具有较高的预测精度。
(1)当i=0,称Xi为因变量序列;(2)当iX0,称Xi为自变量序列。
212 GM(1,1)模型
GM(1,1)模型由一个单变量的一阶微分方程构成。它主要用于复杂系统某一主导因素特征值的拟合和预测,以揭示主导因素变化规律和未来发展变化态势。
设X(0)为非负序列,X(0)={x(0)(k)}n1,其中,x(0)(k)\0,k=1,2,,,n;
X(1)为X(0)的1-AGO序列:X(1)={xn;
的紧邻均值生成序列:Z=(1)n(1)(1)(1){z(k)}2,其中z(k)=(x(k)+x(k-21))k=2,3,,,n;
称x(0)(k)+az(1)(k)=b为GM(1,1)模型的基本形式,其中[a,b]T=(BTB)-1BTY,
x(0)(2)Y=
x(0)(3)sx
(0)
(1)
(k)},其中xZ
(0)
n1
(1)
(k)=
Ex
i
k
(0)
(i),k=1,2,,,
(1)
2 灰色组合预测模型的构建
211 灰色关联度
传统的邓氏关联度利用位移差来反映了序列间发展过程或量级的相近性,进而对序列之间的关联程度进行量化,但研究者们发现邓氏关联度不具有唯一性和规范性,同时无量纲化处理会产生序数效应等缺陷
[15-17]
[14]
为X
(1)
。在介绍灰色组合预测模型前,首
-z(1)(2)
,B=
-z(1)(3)
s-z(1)(n))
11s1
先对灰色关联度模型进行了优化。
定义1设序列Xi=(xi(1),xi(2),,,xi(n)),i=0,1,2,,,m,称$i(k)为序列Xi在(k-1)yk的数据增量,k=2,3,,,n,即
i(k)=xi(k)-xi(k-1)$(1)称Ei为数据增量$i(k)绝对值的平均值,即
(n)
213
关联系数的GM(1,1)预测及加权生成
根据公式(4),可计算序列之间对应元素的灰色关联系数,其对应关系如图1所示。根据灰色关联系数组成的序列可以建立GM(1,1)模型对未来的关联系数进行预测。
Ei=E2|$i(k)|n-1k=
$i(k)的均值化,即5i(k)=|$i(k)|
Ei关联系数,即
0i(k)=C
n
(2)
称5i(k)为序列Xi在(k-1)yk数据增量
(3)
称C0i(k)为序列X0与Xi从(k-1)yk的灰色
1+|50(k)-5i(k)|
n
(4)
图1 自变量序列与因变量序列的
关联度及关联系数
0i为序列X0与Xi的灰色关联度,即称C
C0i=0i(k)(5)E2Cn-1k=
可证明该灰色关联度模型满足:1)规范性;2)偶对对称性;3)接近性;4)保序性;5)唯一性;6)仿射性;7)仿射变换的一致性。(证明略)。
定义2设序列Xi=(xi(1),xi(2),,,xi(n)),i=0,1,2,,,m,
称R0i=(C0i(1),C0i(2),,,C0i(n))为序列X0
与Xi的关联系数序列,根据灰色关联度的规范性,可知R0i为非负序列,满足GM(1,1)模型的建模条件,现在以R0i为基础建立GM(1,1)模型,对C0i(h)(h>n)进行预测。
R0i(1)为R0i的1-AGO,Z(1)为R0i(1)的紧邻均值生成序列,[a,b]=(BB)
T
T
-1
BY,其中
T
#152#中国管理科学 2009年
C0i(2)Y=
C0i(3)sC0i(n)
,B=
-z-z-z
(1)(1)
(2)(3)(4)
11s1
i=1
设Rt=r01(t)+r02(t)+,+r0m(t)=
s
(1)
Er
m
0i
(t),
0102@x01(t)+@x02(t)+RtRt,+
0m@x0m(t)Rt
(11)
则灰色组合预测模型为,x0(t)=
(6)
C
则r0i(h)的预测值为
C
r0i(h)=(1-ea)(r0i(1)-)e-a(h-1)
ax0(h)与xi(h)的关联系数为C0i(h)=Hr0i(h)+(1-H)C0i
C
(7)
综上,灰色组合预测模型的建模流程如图2所
示。
其中HI[0,1],C0i(h)称为由GM(1,1)模型的预测值以及序列X0与Xi的灰色关联度在H(权)下的生成值,表明C0i(h)受到序列之间传统关联关系以及其发展趋势的综合影响,一般H=015。214 预测公式的推导
根据公式(4),得
0i(n)=C
1+|50(n+1)-5i(n+1)|
-1(8)0iy|50(n+1)-5i(n+1)|=
根据定义1,可得到如下推导结果:
(1)当X0为单调增长序列时
1-C0i(n)
x0i(n+1)=x0(n)+[+5i(n+1)]
0i(n)#E0;(9)
(2)当X0为单调衰减序列时x0i(n+1)=x0(n)-[
0i+5i(n+1)]
0i(10)
#E0。
215 灰色组合预测模型的构建
在回归分析中,因变量受到一个或多个自变量的影响并表现出特定的函数关系,而不同的自变量对因变量的影响程度并不相同,这种影响程度通常用回归系数来表示,回归系数越大,表示影响程度越大。类似地,在灰色组合预测模型中,因变量序列与自变量序列之间在灰色关联度的测度下也表现出特定的函数关系,而灰色关联系数则体现了自变量序列对因变量序列的影响程度,关联系数越大,自变量序列对因变量序列的影响就越大,在这个意义上,回归系数与灰色关联系数具有完全相同的含义。
从上面的分析可以发现,与回归分析一样,灰色组合预测模型也是通过事物之间的因果关系建立预测模型,体现了模型的/回归0特性。根据自变量与因变量关联系数所占比重来建立灰色组合预测模型,
图2 灰色组合预测模型的建模流程
3 应用分析
GDP是一个国家或者地区所有常住单位在一定时期内生产活动的最终成果,GDP(X0,单位亿元)、全社会固定资产投资(X1,单位亿元)、进出口总额(X2,单位亿美元)的统计数据见表1。
现要求分别使用:1)灰色组合预测模型;2)回归模型;3)GM(1,1)模型;4)GM(1,3)模型,根据表1中数据,对2007-2008年度我国国内生产总值进行预测,并对预测误差进行比较和分析。(灰色关联度的计算通过笔者编写的Java程序来实现。)
第5期 曾 波等:灰色组合预测模型及其应用
表1 2000-2006我国国内生产总值、固定资产投资及进出口总额
#153#
X0(亿元)X1(亿元)X2(亿美元)
[***********]
[***********]
[***********]8
[***********]2
[***********]48
[***********]21
[***********]607
(数据来自中华人民共和国国家统计年鉴)
(1)灰色组合预测模型
首先根据公式(1)计算序列的数据增量,得表2中的计算结果;再根据公式(3)计算数据增量的均值
化,结果见表(3),最后根据公式(4)计算X1、X2与X0的灰色关联系数,结果如见表4。
表2 2000-2006我国国内生产总值、固定资产投资及进出口总额的/数据增量0
$0(k)$1(k)$2(k)
2000-2001
[1**********]
2001-2002
[1**********]0
2002-[***********]
2003-[***********]
2004-[***********]
2005-[***********]
Ei[***********]21441000
表3 2000-2006我国国内生产总值、固定资产投资及进出口总额的/数据增量均值化0
i(k)50(k)51(k)52(k)
2000-[***********]6
2001-[***********]8
2002-[***********]5
2003-[***********]6
2004-[***********]7
2005-[***********]9
表4 2000-2006我国国内生产总值与固定资产投资及进出口总额的/灰色关联系数0
0i(k)C01(k)C02(k)
2000-[1**********]861
2001-[1**********]837
2002-[1**********]735
2003-[1**********]702
2004-[1**********]489
2005-[1**********]816
根据表4,可得关联系数序列:
R01=(01994,01857,01826,01854,01540,01771),
R02=(01861,01837,01735,01702,01489,01816),
01=002=0计算C1870,C1740。
分别根据R01和R02建立GM(1,1)模型,得预
根据国家统计年鉴,2007年我国的固定资产投资及进出口总额分为为137239和21738,则
x0(7)=209407,r01(7)=01736,E0=2000015。
51(8)=(137239-109870)/128751167,计算得,
x01(8)=2591081243。
同理,x02(8)=2393031114,代入公式(12),得x0(8)=0154@2591081243+0146@2393031114,
x0(8)=24999719。
(2)回归模型
根据EViews对表1中的数据建立回归模型,得
x0=31537x1-111400x2+22971129查统计年鉴得x1和x2的值,计算得,x0(8)=26148814测值分别为:
C
C
r01(7)=01601,r02(7)=01598。加权得(H=015):r01(7)=01736,r02(7)=01669。
建立序列GDP(X0)与全社会固定资产投资(X1)及进出口总额(X2)的回归模型,根据公式(11)得:
x0(8)=0154@x01(8)+0146@x02(8)
01x01(8)=x0(7)+[+51(8)]E0
r01(7)
#154#中国管理科学 2009年
计算得a=-01176,b=627501441,则时间响应式,
x0(k+[1**********],计算得,
x0(8)=29407013。(4)GM(1,3)的模型
C
T
C
视角,分析事物发展变化的影响因素及其影响程度,通过GM(1,1)模型预测影响因素的变化趋势,然后按照回归分析的建模思想构建预测模型。该模型具
有建模简单、所需样本量小、满足/回归性0等特点,应用分析表明了该模型的有效性及实用性。在选择该模型时,一般要求建模数据序列满足单调性,否则会给后续预测结果的分析带来不便;模型主要适用于样本量较小,数据关系复杂,通过传统预测模型难
1)=
4460319591e-011760k
+-
a=[a,b2,b3]6812760]
C
T
=[213807,1516486,-
以获得理想精度的数据预测;同时,该模型对空穴数据的构造也具有一定的参考价值。
x
(1)
(k+1)=(89404-0142@
+0142@
i=2
Ebx
i
3
(1)
i
(k+
参考文献:
[1]张冬青,韩玉兵,宁宣熙.基于小波域隐马尔可夫模型的
时间序列分析)))平滑、插值和预测[J].中国管理科学,2008,16(2):122-127.
[2]闫永权.基于频繁的Markov链预测模型[J].计算机应
用研究,2007,24(3):41-46.
[3]张冬青,宁宣熙等.考虑影响因素的隐马尔可夫模型在
经济预测中的应用[J].中国管理科学,2007,15(4):105-110.
[4]Deng,J.L..Introductiontogreysystemtheory[J].The
JournalofGreySystem(UK),1989,1(1):1-24.[5]崔杰,党耀国.基于一类新的强化缓冲算子的GM(1,1)
预测精度研究[J].控制与决策,2009,24(1):44-48.[6]崔杰,党耀国,刘思峰.基于新弱化算子的GM(1,1)建模
精度分析[J].系统工程理论与实践,2009,29(7):132-138.
[7]董奋义.基于新改进GM(1,1)模型的中国企业债券融资
发展预测[J].中国管理科学,2007,15(4):93-97.[8]王叶梅,党耀国,王正新.非等间距GM(1,1)模型背景值
的优化[J].中国管理科学,2008,16(4):159-162.[9]张岐山.提高灰色GM(1,1)模型精度的微粒群方法[J].
中国管理科学,2007,15(5):126-128.
[10]Dang,Y.G.,Liu,S.F.,Chen,K.J..Themodelthat
betakenasinitialvalue[J].Kybernetes,2004,33(2):247-254.
[11]李希灿,李丽.时序残差的GM(1,1)模型[J].系统工程
理论与实践,1998,(10):59-63.
[12]谢乃明,刘思峰.离散GM(1,1)模型与灰色预测模型建
模机理[J].系统工程理论与实践,2005,(1):93-98.[13]Liu,S.F.,Deng,J.L..TherangesuitableforGM(1,
1)[J].TheJournalofGreySystem,1999,11(1):131-138.
[14]Liu,S.F.,Lin,Yi..GreyInformation:Theoryand
PracticalApplications[M].London:Springer-Verlag,2006:82-98.
.J].1))@e
-213807k
E
3
bix(i1)(k+1),计算得
i=2
x0(8)=31350714。
上述4种模型的预测结果及误差,见表5。
表5 2007年我国GDP的预测值及误差
组合模型回归模型GM(1,1)
GM(1,3)
实际值[***********]246619
预测值[***********][1**********]714
预测误差1137%6103%19124%
27112%
再分别使用上述4种模型预测我国2008年的GDP,预测结果及误差见表6。
表6 2008年我国GDP的预测值及误差
组合模型回归模型GM(1,1)GM(1,3)
实际值[***********]300670
预测值[***********][1**********]012
预测误差3138%13155%16162%23150%
从表5和表6可以看出,灰色组合预测模型的预测误差小于其它三种模型。由于样本量小,因此回归模型难以获得理想的精度;而GM(1,1)模型仅
从GDP数据序列本身去寻找数据变化规律,没有考虑其它信息对GDP的影响,因此精度较低;GM(1,3)模型在理论上还不成熟,由于误差累积的影响导致其预测精度不高;灰色组合预测模型集成了回归分析及灰色理论的优点,因此获得了较好的预测效果。
4 结语
第5期 曾 波等:灰色组合预测模型及其应用#155#
国管理科学,2003,11(5):76-79.
[16]崔杰,党耀国,刘思峰.几类关联分析模型的新性质
[J].系统工程,2009,27(4):65-70.
[17]孙玉刚,党耀国.灰色T型关联度的改进[J].系统工程
理论与实践,2008,(4):135-139.
GreyCombinedForecastModelsandItsApplication
ZENGBo,LIUS-ifeng,FANGZh-igeng,XIENa-iming
(SchoolofEconomicsandManagement,NanjingUniversityofAeronauticsandAstronautics,Nanjing210016,China)
Abstract:Traditionalregressionmodelsneedenormoushistoricdata,anditisveryhardtobuildthiskindofmodel.Withthoselimitations,agreycombinedforecastmodel,basedongreyincidencedegreeandGM(1,1)model,isputforward.Thismodelseeksdependencyrelationshipsofsequencesbasedonthegreyincidencesdegree,employstheGM(1,1)modeltoforecastthetrendofdevelopmentamongdata,andthenaforecastmodelaboutdependentvariableissetup.Themodelnotonlyreflectsthemodelingthoughtofregressionanalysisbasedoncausality,butalsohasthecharacteristicsofsmallexampleforbuildingmodel.TheGDPin2007and2008areforecastedwiththismodel,andtheresultsillustratethevalidityandpracticabilityofthenovelmodel.
Keywords:forecasttechnology;combinedforecastmodel;greyincidencedegree;regressionanalysis;GM(1,1)model