基于时序全局主成分分析的广西经济发展动态描绘
广西科学院学报 2008, 24(3) :168~170Journal of G uang xi Academy of Sciences V ol. 24, N o. 3 A ug ust 2008
基于时序全局主成分分析的广西经济发展动态描绘*The Application of Time Series Analysis and All -around PCA in the Economic Dynamic Description of Guangxi Province
鄢 寒, 吴群英
YAN Han , WU Qun -ying
(桂林工学院数理系, 广西桂林 541004)
(Department of Mathematics and Physics, Guilin University of Technology , Guilin, Guangx i, 541004, China )
摘要:选取广西1990~2005年的地区生产总值、第一产业产值、第二产业产值、第三产业产值、财政收入、社会消费品零售总额、固定资产投资等7个指标16年的数据, 利用时序全局主成分分析方法动态描绘广西1990~2005年的经济发展历程。描绘结果显示, 1998年以前广西的经济发展速度较慢, 1998年以后, 广西经济发展有所加快, 尤其是2001~2005年经济发展保持持续快速发展的势头。描绘结果与广西经济发展实际情况基本吻合, 时序全局主成分分析方法可以综合评价国民经济的发展状况。关键词:时序分析 主成分分析 经济 发展
中图法分类号:O 212, F 124. 1 文献标识码:A 文章编号:1002-7378(2008) 03-0168-03
Abstract :In this article, the GDP, the total value of the primary industry, the total v alue of the secondary industry , the total value of the tertiary industry , financial revenue , the total retail sale of consum er g oods and the fixed assets investm ent from 1990to 2005are selected . T he econom ic course of Guangx i from 1990to 2005dynam ically by means of time series analysis and all-around PCA is described. The result is as follow s:the rate of Guang xi economic development is slow before 1998and speed up after 1998. Particularly , the sustained and rapid development economy is kept in 2001~2005. The result has shown that the dynamic track can accord with the fact. T herefore, time series analysis and all around PCA can be used in comprehensive ev aluation of the econom ic development .
Key words :time series analysis , all -around PCA , economic , development 近年来, 如何科学地综合评价国民经济发展已经成为经济统计界十分关注的问题。要全面系统地分析一个地区的经济发展问题, 必须考虑众多对经济过程有影响的因素, 因为每一个变量都在不同程度上反映了所研究的某些信息, 因而使评价系统具
收稿日期:2007-07-25修回日期:2007-10-31
作者简介:鄢 寒(1985-) , 男, 硕士研究生, 主要从事概率与统计研究。
*国家自然科学基金项目(10661006) , 广西“新世纪十百千人才工程”专项资金(2005214) 及广西自然科学基金项目(桂科自0728212) 有样本庞大、指标众多及动态变化等特性。而时序全
局主成分分析方法正是针对上述研究内容提出的一种解决方法, 它为经济决策提供了一种快速、科学的
[1]
量化分析工具。主成分分析是一种利用降维的思想, 将多指标化为少数几个综合指标的多元统计分析方法, 它认为在众多有相关性的因素之间必然存在着起支配作用的共同因素, 于是通过对原始变量相关矩阵内部结构关系的研究, 找出影响某一经济过程的几个综合指标, 这些指标不仅保留了原始的主要信息, 又使其彼此之间不相关, 比原始变量具有某些更优越的性质, 使得人们在研究复杂的经济[2]
鄢 寒等:基于时序全局主成分分析的广西经济发展动态描绘
169
法在主成分分析的基础上, 以一个综合变量来取代原有的全局变量, 再以此为基础描绘出系统的总体水平随时间的变化轨迹[3]。
从改革开放以后, 广西经济得到了很大发展, 如何建立一个既能反映广西经济发展又符合客观历史的模型, 对于政府决策部门今后做出正确的经济决策至关重要。本文选取广西1990~2005年的相关数据, 利用时序全局主成分分析方法对广西1990~2005年的经济发展进程进行动态描绘, 探讨时序全局主成分分析方法在综合评价国民经济发展方面的应用。
为了表述简洁, 标准化后的指标仍记为X 1~X 7。标准化后的指标值见表2。
表2 标准化后的指标值
年份[***********][***********][***********]0320042005
时序[***********]41516
X 1
X 2
X 3
X 4
X 5
X 6
X 7
-1. 376-1. 511-1. 394-1. 265-1. 182-1. 356-1. 214-1. 308-1. 425-1. 335-1. 200-1. 053-1. 288-1. 166-1. 183-1. 250-1. 214-1. 100-0. 978-1. 170-1. 051-0. 964-1. 171-0. 864-0. 930-0. 485-0. 977-0. 745-0. 646-0. 782-0. 475-0. 715-0. 963-0. 748-0. 511-0. 355-0. 229-0. 302-0. 455-0. 719-0. 480-0. 420-0. 160-0. 0440. 0480. 1060. 2120. 4060. 6440. 9341. 5302. 155
0. 151-0. 168-0. 302-0. 562-0. 279-0. 3010. 373-0. 098-0. 200-0. 439-0. 121-0. 2940. 3910. 3030. 2550. 3430. 4620. 7251. 4631. 902
0. 041-0. 116-0. 1480. 0810. 2130. 3130. 5110. 8701. 5752. 247
0. 0300. 1870. 5110. 8371. 0731. 4922. 155
0. 0490. 2410. 6900. 8041. 0451. 5292. 172
0. 033-0. 0880. 1780. 3510. 5450. 7741. 0921. 4861. 961
0. 0200. 1090. 2690. 5010. 8421. 4602. 590
1 样本数据选取及数据预处理
1. 1 样本数据
选取广西1990~2005年的地区生产总值(亿元) (X 1) 、第一产业产值(亿元) (X 2) 、第二产业产值(亿元) (X 3) 、第三产业产值(亿元) (X 4) 、财政收入(万元) (X 5) 、社会消费品零售总额(万元) (X 6) 、固定资产投资(万元) (X 7) 等7个指标一共16年的数据, 作为反映经济发展的样本点。各项统计数据见表1。
表1 各样本原始指标值[4]
年
份
时序
X 1
X 2
X 3
X 4
X 5
X 6
X [1**********]79
[4]
2 广西经济发展动态描绘
2. 1 主成分选取
用SPSS13. 0软件对标准化后的数据进行主成分分析得到特征值、载荷矩阵和主成分得分系数分别见表3、表4和表5。
表3 标准化后的指标间相关系数矩阵的特征值、方差贡献率和累计方差贡献率
主成分1234567
特征值 6. 835
0. 1120. 0400. 0090. 0030. 0017. 86E-13
方差贡献率
(%) 97. 650
1. 5960. 5660. 1274. 50E-021. 60E-021. 12E-11
累计贡献率
(%) 97. 650
99. 24699. 81299. 93999. 984100100
[***********]34
449. 06176. 77118. 45153. [***********]. 59195. 17141. 02182. [**************]
646. 60233. 03187. 48226. [***********]0395871. 70250. 11321. 10300. [***********]0754
199451198. 29333. 79469. 81394. [***********][1**********]97. 56453. 15535. 86508. [***********][1**********]97. 90534. 88587. 37575. [***********][1**********]17. 25582. 74614. 07620. [***********][1**********]11. 30586. 70667. 29657. [***********][**************]. 41567. 72682. 34721. [***********][**************]. 04557. 38732. 76789. [***********][**************]. 34576. 34771. 18931. [***********][**************]. 73601. 99846. 891074. [***********][**************]. 11658. 78984. 081178. [***********][**************]3. 50817. 881253. 701361. [***********][**************]75. 75912. 501510. 701652. [***********]7690715
表4 载荷矩阵
主成分
2
X 1
X 30. 996
X 60. 9960. 044
X 40. 995
X 70. 987
X 2
X 5
1 0. 9990. 9750. 969 0. 0070. 038 0. 0540. 044
1. 2 数据预处理
由于各经济指标具有不同的量纲, 在进行主成分分析之前需要对数据进行处理, 以消除由于量纲的不同可能带来的不合理影响。对原始数据进行标
i -′
准化处理, 标准化的计算公式为x i =, 其中
S ′
x i 为原始数据, -x 为数据均值, S 为标准差, x i 为标准0. 043-0. 0560. 003-0. 070-0. 2040. 241 0. 085-0. 142
0. 015
3-0. 0065
0-7. 59E -07
0. 029-0. 072
4-0. 016-0. 048-0. 012-0. 034
0. 029-0. 040-0. 013
0. 023
3. 24E -07
6-0. 009-0. 013-0. 0107
0. 018-0. 0070. 013 0. 014-0. 0050
3. 49E 1. 59E -12-07
2. 83E -4. 83E -2. 57E
-07-13-11
170
表5 第一主成分得分系数
原始变量X 1X 2X 3X 4X 5X 6X 7
第一主成分0. 14610. 14170. 14560. 14580. 14260. 14560. 1444
广西科学院学报 第24卷第3期 2008年8月
图1动态轨迹结果表明, 1998年以前广西的经济发展速度较慢; 1998年以后, 广西经济发展有所加快, 尤其是2001~2005年经济发展保持持续快速发展的势头。
3 结束语
广西1998年以前经济发展速度较慢, 工业基础薄弱。改革开放以来, 全国经济迅速发展, 但是广西的经济发展起步较晚, 1990~1998年地区生产总值只增加了1462. 24亿元, 其中, 第一产业409. 93亿元, 增长5. 8%; 第二产业548. 84亿元, 增长13. 9%; 第三产业503. 47亿元, 增长6. 4%。1998年以后, 广西实施了“三大战略, 六大突破”, 为经济发展打下了良好的基础。同时, 西部大开发战略的实施, 给处于西部地区的广西经济发展提供强大的支撑力。特别是中国-东盟自由贸易区的构建以及中国-东盟博览会永久落户广西南宁, 为推动广西经济的迅速发展提供了极好的发展机遇。1998年至2005年地区生产总值增加了2164. 45亿元, 其中, 第一产业325. 80亿元; 第二产业843. 41亿元; 第三产业995. 26亿元。
随着近年来东部地区土地、劳动力等成本优势的逐渐丧失, 产业结构进入调整与升级阶段, 广西抓住这一机遇, 从2001年开始大规模的承接东部产业转移, 通过充分发掘比较优势, 积极承接东部产业转移, 加快经济发展, 使经济发展保持了持续快速发展的势头。
由以上的分析可以看出, 时序全局主成分分析模型所绘出的曲线对广西经济发展的描述与广西实际情况基本吻合, 说明时序全局主成分分析方法对广西经济发展的动态描述是合理的, 其分析方法可以用于综合评价国民经济的发展状况, 其评价结果可以为有关部门的决策提供参考依据。
参考文献:
[1] 乔峰, 姚俭. 主成分分析方法在经济发展动态描绘中的
应用[J]. 数理统计与管理, 2003, 22(2) :1-5.
[2] 何晓群. 多元统计分析[M ].北京:中国人民大学出版
社, 2004.
[3] 任若恩, 王惠文. 多元统计数据分析——理论、方法、实
例[M ].北京:国防工业出版社, 1997.
[4] 广西壮族自治区统计局. 广西统计年鉴2006[M ].北
京:中国统计出版社, 2006.
[4]
由表3结果可知第一主成分的累积方差贡献率已达97. 65%, 基本上保留了原来指标的信息。另外由表4结果可知第一主成分地区生产总值与各原始变量的因子负荷量都为正值且都在0. 969以上, 说
明第一主成分基本反映了广西各年份的经济发展水平的信息。
2. 2 构造综合评价模型
确定主成分后, 用一个新变量F 来代替原来的7个指标, 即可用F 为综合评价指标来进行综合评价。由表5可知F 的线性组合为F =0. 1461X 1+0. 1417X 2+0. 1456X 3+0. 1458X 4+0. 1426X 5+0. 1456X 6+0. 1444X 7,
代入数据即得出16个综合评价值F (见表6) 。
表6 各样本综合评价值
年份1990
[***********][***********][***********]042005
时序[***********]41516
F --------1. 34381. 26871. 14890. 88720. 69890. 42770. 23490. 11970. 02250. 11060. 22660. 44460. 65570. 95171. 52312. 1953
2. 3 时序分析
根据每年的综合评价值F 绘制的时间序列变化结果如图1
所示。
(