31个省经济发展情况因子分析
广东财经大学金融学院
金融硕士
课程论文
31个省级行政单位经济发展水平的因
子分析
课程名称 姓 名 学 号 班 级
经济应用软件
王
14金融
广东财经大学研究生课程考试(论文形式) 评阅纸
研究生姓名
成绩 评阅人签名:
说明:每篇论文前均需附有此评阅纸。
研究生处制
摘要
经济发展水平是指一个地区经济发展的规模、速度和所达到的水准。本文选取我国31个省级行政单位的的相关数据,数据包括GDP 、城镇居民可支配收入、农村居民可支配收入、进出口总额、财政收入、人均存款和汽车保有数。利用因子分析方法研究31个省级行政单位的经济发展水平状况,得出各省级单位经济发展水平的因子得分并进行排名。最后,就研究结果所反映的问题给出了一些针对性的建议。
关键词:经济发展;因子分析;因子得分
引言
纵观我国几十年的经济发展的历史,可以骄傲的说这是一个奇迹,中国的综合国力显著提高,国家整体国际竞争力排名世界前列。中国这条巨龙终于开始腾飞。然而,我国经济发展过程中存在的一些问题也开始慢慢浮现。相对于东部来说,中西部的经济发展十分缓慢,由于地理环境差异、改革开放后政策向东部倾斜以及中西部地区自身的问题等,我国各省之间的经济发展水平不平衡问题越来越突出。因此,研究我国各省经济发展水平的意义就显得十分必要,对我国经济的协调发展具有重大的现实意义。
本文选取全国31个省、市、自治区、直辖市的的相关数据,数据包括GDP 、城镇居民可支配收入、农村居民可支配收入、进出口总额、财政收入、人均存款和汽车保有数。利用因子分析方法进行问题的研究。
因子分析就是以最少的信息丢失为前提,将众多的原有变量综合成少数几个综合指标。人们在对某一现象进行观测时,往往会得到大量指标或变量的观测数据,这些数据在带来现象的的有关信息时,也会给数据的分析带来了一定困难;另一方面,这些众多的变量之间可能存在着相关性,实际测到的数据包含的信息有一部分可能是重复的。因子分析就是在尽可能不损失信息或者少损失信息的情况下较少为少数几个潜在的因子,这几个因子可以高度概括大量数据中的信息,这样一来,既减少了变量个数,又能再现变量之间的内在联系。例如,服装厂做衣服需要掌握人身体各部位的尺寸:衣长、裤长、臂长、袖长、肩宽等,这些指标因人而异,都是一些随机变量,但是这些随机变量之间又存在明显的联系,服装厂在生产衣服时不可能真正做到“量体裁衣”,他们需要从这许多指标中概括出少数几个关键性指标,然后依据这些指标进行加工,这样生产出来的衣服就能适合大多数人的体型。这些少数几个指标虽然不能反映人的体型的全部信息,但是却高度的概括和集中了绝大部分信息。 一、研究过程
1、基本描述统计分析
常见的基本猫叔分析大致可以分为两大类:第一,刻画集中趋势的描述性统计量;第二,刻画离散程度的描述性统计量。集中趋势是指一组数据向某一中心值靠拢的倾向。计算刻画集中趋势的描述性统计量正是要寻找能够哦反映数据一般水平的“代表值”和“中心值”。均值是一种常用的代表值和中心值,又称算术平均数,在统计学中占有重要地位,反映某些变量所有取值的集中趋势或平均水平。离散程度是指一组数据远离其中心值的程度,常用的刻画;离散程度的描述性统计量有极值、样本标准差和样本方差。本文进行描述性分析时选取的指标有:极大值、极小值、均值、标准差和方差。软件设置及运行结果如下:
图1基本描述统计量选择窗口
图2基本描述统计分析结果
图2可知,31个省级行政单位GDP 的极小值是920.8亿元,最大值为67792.24亿元,均值为22073.1413亿元,标准差为16986.3,离散程度较大,说明我国各省市经济发展水平很不均衡。农村居民人均可支配收入的极小值为5736.00,极大值为21192.00,均值均值为10885.0968,农村居民人均可支配收入的最高值是最低值的3.7倍,说明我国各省农村居民贫富差距很大。其他各变量的分析与之类似。
2、因子分析
因子分析就是以最少的信息丢失为前提,将众多的原有变量综合成少数几个综合指标。本文的因子分析如下:
(1)考察原有变量是否适合因子分析
首先考察收集到的原有变量之间是否存在一定的线性关系,是否适合采用因子分析方法。文章借助变量的先关系数矩阵、巴特利特球度检验和KMO 检验方法进行分析。
图3变量的相关系数矩阵
图3是各个变量的相关系数矩阵。可以看到大部分相关系数都较高,各变量呈较强的线性关系,能够从中提取公共因子,说明变量适合进行因子分析。
图4 KMO和Bartlett 的检验结果
图4给出了KMO 和 Bartlett 的检验结果,由图知,巴特利特球度检验统计量的观测值为316.456,相应的概率p 值接近0. 如果显著性水平为0.05,由于概率p 小于显著性水平,应拒绝零假设,认为相关系数矩阵与单位阵有显著差异。同时,KMO 值为0.713,根据Kaiser 给出的KMO 度量标准可知,原有变量适合进行因子分析。
(2)提取因子
本文首先进行尝试性分析。根据原有变量的相关系数矩阵,采用主成分分析法提取因子,并选取特征值大于1的特征根。分析结果如图5.
图5因子分析初始解
图5是因子分析初始解,显示了所有变量的共同度数据。第一列是因子分析初始解下的变量共同度,它表明对原有9个变量,如果采用主成分分析方法提取所有特征值,那么原有变量的所有方差都可被解释,变量的共同度均为1. 第二列是在按指定提取条件(特征根大于1)提取特征指时的变量共同度。从该表可以看出因子分析的变量共同度都非常高,都达到了0.8以上。表明变量中的大部分信息均能够被因子所解释,各个变量的信息丢失都较少,说明本文因子分析的结果是有效的。
图6因子解释原有变量总方差的情况
图6是因子解释原有变量总方差的情况。第一列是因子编号,以后三列组成一组,每组中数据项的含义一次为特征值、方差贡献率和累计方差贡献率。第一组数据项描述了城市因子解的情况。第一个因子的特征值为4.855,解释原有7各变量总方差的69.352%,累计贡献率为69.352%。第二个因子的特征值为1.604,解释各变量总方差的22.916%,累计贡献率为92.268%。其余含义与之类似。
第二组数据项描述了因子解的情况。由图知,由于指定提取两个因子,两个因子共解释了原有变量总方差的92.268%。说明总体上原有变量的信息丢失较少,因子分析结果理想。
第三组数据项描述了最终因子解的情况。由图知,因子旋转后,
累计方差贡
献度提高了,由48.084%提高到了92.268%,使得因子分析效果更加理想。
图7因子的碎石图
图7是因子的碎石图,横坐标为引子数目,纵坐标为特征值。可以看到,第一个因子的特征值很高,对解释经济发展的贡献最大。第三个以后因子特征值都很小,对经济发展的解释可以户略。因此提取两个因子是合适的。
图8因子载荷矩阵
图8是因子载荷矩阵,是因子分析的核心内容。由图知,所有变量在第一个因子上的载荷都很高,意味着它们与第一个因子的相关程度高,
第一个因子很重
要。城镇居民可支配收入和人均存款数两个变量在第二个因子上的载荷较高,意味着它们与第二个因子的相关程度较高。
(3)因子的命名解释
这里采用了方差最大法对因子载荷矩阵实施正交旋转以使因子具有命名解释性。指定按第一因子载荷降序的顺序输出旋转后的因子载荷以及因子载荷图。分析结果如下:
图9旋转后的因子载荷矩阵
图9给出了旋转后的因子载荷值,由图可知,人均存款数、城镇居民可支配收入、农村居民可支配收入三个因素在第二个因子上具有较高的载荷,第2个因子主要解释了这三个变量,可以解释为居民收入情况。其他变量在第一个因子上的载荷很高,第1个因子主要解释了这几个变量,可以解释为政府收入。
图10因子旋转中的正交矩阵
图11旋转后的因子载荷图
图11是旋转后的因子载荷图,由图可知,人均存款量、城镇居民可支配收入、农村居民可支配收入、汽车保有数、GDP 比较靠近坐标轴,说明可以用第一个因子刻画汽车保有数、GDP ,可以用第二个因子刻画人均存款量、城镇居民可支配收入、农村居民可支配收入。
图11因子协方差矩阵
图11是两因子的协方差矩阵。由图可知,两因子没有线性相关性,实现了因子分析的目标。
(4)计算因子得分
本文采用回归法估计因子得分系数,并输出因子得分系数。运行结果如下:
图12因子得分系数矩阵
图12是因子得分系数矩阵,由图可得出因子得分函数:
F 1=0.353GDP-0.074城镇居民可支配收入-0.089农村居民可支配收入+0.194进出口总额+0.265地方财政收入-0.152人均存款+0.358汽车保有数。
F 2=-0.134GDP+0.340城镇居民可支配收入+0.345农村居民可支配收入+0.062进出口总额-0.002地方财政收入+0.388人均存款-0.161汽车保有数。
通过因子分析可以得到因子得分情况,并计算各个省级行政单位的经济发展水平的总得分,用方差贡献率作为权数计算各省市的得分,因子模型为:
F=0.7516F1+0.2484F2
根据上面的模型,来计算各个省级行政单位的经济发展水平的总得分,并进行排名(见表1)。因子得分大于零表式该省市经济发展水平高于全国的平均水平,而得分小于零则表示该省市的经济发展水平低于全国的平均水平。从因子得分表我们可以看出,广东、江苏、山东、浙江、北京、上海、河北、河南、四川、辽宁、福建等省市的经济发展水平高于全国的平均水平,而其余省份经济发展水平低于全国的平均水平。
表1各省的因子得分
二、研究结论
本文利用GDP 、城镇居民可支配收入、农村居民可支配收入、进出口总额、财政收入、人均存款和汽车保有数等数据考察全国31个省的经济发展水平,建立因子模型,运用基本描述分析和因子分析的方法对全国31个省的经济发展水平进行了实证研究。研究结果表明,①全国31个省的经济发展水平存在很大的差异。②全国31个省的多数省份的经济发展水平低于全国平均水平,只有广东、江苏、山东、浙江、北京、上海等11个省的经济发展水平高于全国平均水平。③各省的GDP 、进出口总额和居民可支配收入对经济发展水平的影响很大。 三、本文的建议
本文认为我国在经济发展的过程中应该更加注重各地区之间的协调发展,在我国还有很多省份经济发展水平低于全国水平,要加快贫困地区的政策支持力度,特别是加大西部地区省份在基础设施建设、人力资源开发、扩大对外开放、提高全体居民基本的公共服务水平等方面的支持力度,大幅度地扩大西部地区持
续、长期的发展后劲。各省在经济发展过程中不仅要注重GDP 的增长,还应该更加注重增加居民的可支配收入,提升居民幸福感指数。
参考文献
[1] 薛薇:《SPSS 统计分析方法及应用》(第三版)北京:电子工业出版社 2013.7