固定资产分析论文
统计学《课程设计》论文
基于主成分回归的固定资产投资产业分析
Based on the principal component regression analysis of
investment in fixed assets
学 院:理学院 专 业:统计学
姓 名: 学 号:
论文提交日期:二年一二年十一月
摘 要
固定资产投资的稳定快速发展是现代化建设的重要推动力和组成部分。本文通过多元统计分析的主成分回归研究农林渔业、采矿业、制造业、电力燃气供应业、建筑业、房地产业、水利环境、文化体育娱乐这几项指标对固定资产投资的影响,建立主成分回归模型。通过对模型的经济意义解释,分析了这八项指标对固定资产投资的影响,为政府制定宏观经济政策指明方向和提供依据。
关键词:主成分回归;固定资产投资; 参数估计;经济意义
Based on the principal component regression analysis of
investment in fixed assets
Abstract
Investment in fixed assets of the stable and rapid development of modernization construction is the important impetus and part. In this paper, by means of multivariate statistical analysis the principal component regression of Agriculture Forestry and fisheries, mining, manufacturing, electricity gas supply industry, construction industry, real estate industry, water environment, cultural and sports entertainment that several indicators of investment in fixed assets, establish the model of principal component regression. Based on the model to explain the economic significance, analyzes the eight index of fixed assets investment effect, for the government to formulate macroscopically economic policy direction and provide the basis .
Key words: principal component regression; fixed assets investment; parameter estimation; economic significance
1. 引言
1.1 研究背景
固定资产投资是建造和购置固定资产的经济活动动,即固定资产再生产产活动。固定资产再生产过程包括固定资产更新(局部和全部更新)、改建、扩建、新建等活动。固定资产投资是社会固定资产再生产的主要手段。固定资产投资额是以货币表现的建造和购置固定资产活动的工作量,它是反映固定资产投资规模、速度、比例关系和使用方向的综合性指标。而对固定资产投资产生重大影响的包括农林渔业、采矿业、制造业、电力燃气供应业、建筑业、房地产业、水利环境、文化体育娱乐等等指标,但这些指标影响有深有浅,所以研究这些指标的影响就具有一定的意义。
1.2 研究意义
固定资产投资是社会固定资产再生产的主要手段。通过建造和购置固定资产的活动,国民经济不断采用先进技术装备,建立新兴部门,进一步调整经济结构和生产力的地区分布,增强经济实力,为改善人民物质文化生活创造物质条件。这对我国的社会主义现代化建设具有重要意义。
1.3 研究现状
一、固定资产投资是企业和国家最为重要的经济活动之一,一直是党和国家关注的重要问题,党的十七届五中全会对我国经济发展明确提出了“完善投资体制机制,提高投资质量和效益”的要求。近年来国内许多学者研究发现,微观层面的企业固定资产投资状况并不令人满意,效率低下。辛清泉、林斌和杨德明(2007)发现,我国上市公司1999一2004年5年累计新增投资收益率仅为2.6%,远低于资本成本;张功富、宋献中(2009)发现,2001-2006年间,沪深301家工业类上市公司最优投资率平均为年初固定资产净值的24.4%,39.26%的公司投资过度,实际投资平均水平超出其最优投资的100.66%;其中有60.74%的公司投资不足,实际投资平均水平仅达到其最优投资的46.31%,周伟贤(2010)研究表明,在2004-2008年度,我国非金融类上市公司发生非效率投资行为现象较为普遍,且投资不足比投资过度更为严重。以上学者的研究表明:伴随着我国经济的高速发展,企业的固定资产投资问题十分突出,已严重影响到国家经济的健康有效运行。
参考文献:《现代商贸工业》2012年第06期 作者:蔡艳芳;蒋瑜峰; 二、制造业和房地产业投资增长贡献率高,基础设施行业投资贡献率低
2012年1-3月,制造业、房地产业、基础设施行业(含电力、燃气及水的生产和供应业,水利、环境和公共设施管理业,交通运输、仓储和邮政业)投资增速分别为24.8%、27.0%和1.8%。尽管制造业和房地产业投资名义增速较上年有明显回落,但由于其投资增速高于固定资产投资平均增速,故其投资增长贡献率较上年同期上升;基础设施投资增速远低于固定资产投资平均增速,故其投资增长贡献率下降。
从实际增长状况看,剔除固定资产投资价格变动影响后,2012年1-3月制造业、房地产业、基础设施行业实际增速分别为22.0%、24.1%和-0.5%,制造业投资实际增速略高于上年同期,但低于上年全年增速;房地产业则不仅高于去年同期,而且高于去年全年增速;基础设施投资下降幅度较去年全年扩大0.4个百分点。
来源:中国投资 作者:国家发改委投资研究所副所长 作者:杨萍
1.4 研究方向
由于固定资产投资产业较多,包括农林渔业、采矿业、制造业、电力燃气供应业、建筑业、房地产业、水利环境、文化体育娱乐,所以本文首先对固定资产投资各个产业进行最优子集筛选,然后对最优子集变量进行主成分分析,以达到降维目的,再把4个主成分作为自变量关于固定资产投资作回归分析,通过对经济意义的检验,为政府制定宏观经济政策指明方向和提供依据。
2.理论模型建立
1. 主成分的数学模型
设X(X1,,Xp)是p维随机向量,均值E(X)U,协差阵D(X)。考虑它的线性变换:
Z1a1'Xa11X1a21X2ap1Xp'
Z2a2Xa12X1a22X2ap2Xp (ⅱ)
Za'XaXaX2appXp
p1p12pp
'
易见
Var(Zi)aiai
Cov(Zi,Zj)aia
'
j
'
(i1,2,,p) (i,j1,2,,p)
定义(ⅱ)设XX1,,X分(i1,2,,p),如果: ①aiai
'
p
'为p维随机向量。称Zi
aiX为X的第i主成
'
1;
'
(i1,2,,p)
②当i1时aiaj0;③
(j1,2,,i1)
Var(Zi)
a'a1,a'aj0(j1,,i1)
MaxVar(a'X)
(2)模型的几何解释:
为了方便,我们在二维空间中讨论主成分的几何意义:
设有n个样品,每个样品有两个观测变量xl和x2,在由变量xl和x2 所确定的二
维平面中,n个样本点所散布的情况如椭圆状。由图可以看出这n个样本点无论是沿着xl 轴方向或x2轴方向都具有较大的离散性,其离散的程度可以分别用观测变量xl 的方差和x2 的方差定量地表示。显然,如果只考虑xl和x2 中的任何一个,那么包含在原始数据中的经济信息将会有较大的损失。
如果我们将xl 轴和x2轴先平移,再同时按逆时针方向旋转角度,得到新坐标 Fl和F2。Fl和F2是两个新变量。 平移、旋转坐标轴x1
F1
根据旋转变换的公式: y1x1cosx2sin
y2x1sinx2cos
sinx1y1cos
ysincosxUx
22
UU
1
,UUI
由此可概括出主成分分析的几何意义:
主成分分析的过程也就是坐标旋转的过程,各主成分表达式就是新坐标系与原坐标系的转换关系,新坐标系中各坐标轴的方向就是原始数据方差最大的方向。 (3)主成分的求解
①第一主成分:
11121P21222P
P1P2PP
设X的协方差阵为: X
由于x为非负定的对称阵,则有利用线性代数的知识可得,必存在正交阵U,使得
1
UΣXU
0
0 p
其中1,2,,p为x的特征根,不妨假设12p。而U恰好是由特征根相对应的特征向量所组成的正交阵。
u11u21
U(u1,,up)
up1
u12u22up2
u1p
u2p
upp
Uiu1i,u2i,,upii1,2,,P
下面我们来看,是否由U的第一列元素所构成为原始变量的线性组合是否有最大的方差。 设有P维正交向量a1a11,a21,,a
p1
Y1a11X1a1pX
p
a'X
1
V(Y1)a1a
2
1a1U
Ua1
p
p
i
aui
ui
a
i1p
i
(au
i
)
2
i1
p1(aui)
2
i1p
1auiui
a
i1
1aUUa1aa1
当且仅当a1u1时,即Y1u1X11up
X1p时,有最大的方差1。Va(r1F)
U1'
x1U如果第一主成分的信息不够,则需要寻找第二主成分。1
② 第二主成分
在约束条件cov(Y1,Y2)0下,寻找第二主成分 Y2u12X1up2
X
p
因为cov(Y1,Y2)cov(u1x,u2x)u2u11u2u10 所以u2u10
p
p
则,对p维向量uu2
2,有V(Y2)2u
2
iu2uiuiu2i(u2ui)
i1
i1
p
2u2uiuiu
2
2u2UUu
2
2u2u2
2
i1
所以如果取线性变换:Y2u12X1u22X
2
u
p2
X
p
则Y2的方差次大。
为
因
Y1u11X1u21X2up1Xp
类推Y2u12X1u22X2up2Xp
Ypu1pX1u2pX2uppXp
写为矩阵形式:YUX u11u21
U(u1,,up)
up1
u12
u22up2
u1pu2p
upp
X(X1,X2,,Xp)
上述推导表明:变量x的主成分y是以的特征向量为系数的线性组合,它们互不相关,方差为
的特征根。而
得特征根12
p
0
,所以
Var(y1)Var(y2)Var(yp)0。
(4)主成分回归步骤:
①.原始指标数据的标准化采集p维随机向量x=(x1,X2,...,Xp)T)n个样品
xi=(xi1,xi2,...,xip)T,i=1,2,…,n,
n>p,构造样本阵,对样本阵元进行如下标准化变换:
其中,,得标准化阵Z。
②.对标准化阵Z求相关系数矩阵
其中,。
得p个特征根,确定主成分
③.解样本相关矩阵R 的特征方程
按确定m值,使信息的利用率达85%以上,对每个
λj,j=1,2,...,m,解方程组Rb=λjb得单位特征向量。
④.将标准化后的指标变量转换为主成分
U1称为第一主成分,U2称为第二主成分,…,Up称为第p主成分。
⑤.对m个主成分进行综合评价
对m个主成分进行加权求和,即得最终评价值,权数为每个主成分的方差贡献率
2.1主成分数学模型、2.2主成分几何意义(简略一点)、2.3主成分推导、2.4主成分回归步骤。都在书上自己掂量一下,该简略的简略,该详细的详细,主要是公式。。。。廖梦(2天)
3. 实证分析
3.1 样本数据的选取与处理
本文选取2010年各地区按主要行业分的全社会固定资产投资(数据见附录),各个行业一共有19个,包括有农林渔业、采矿业、制造业、电力燃气供应业、建筑业、交通运输业、信息计算机服务和软件业、批发零售业、住宿餐饮业、金融业、房地房地产业、租赁商务服务业、科学研究技术服务地质勘查业、水利环境公共设施管理业、教育、社会福利业、文化体育娱乐业、公共管理和社会组织。由于每个行业数据间绝对数值差异较大,为了个更准确地反映出每个行业对固定资产投资影响程度的相对重要性,我们采取将原始样本数据标准化。
标准化公式为:x
*ij
xi1,2,...,n;j1,2,...,p
yi
*
i1,2,.n. . , (1)
n
其中Lyy
(x
i1
ij
2
j)是自变量xj(j1,2,...,p)的离差平方和。运用(1)式得到标准化
后的数据(见附录)。
考虑到行业指标数量众多,为了回归方程的简洁性、有效性,必须要剔除
一些包含冗杂信息的产业指标。
根据自由度调整复决定系数Ra2达到最大准则选择最优子集回归模型,SAS输出结果如下:
图 1 最优子集的选择
从SAS输出来看,可决系数R2都是大于0.95,意味着所有子集组合对数据
拟合效果都很好,但是考虑到模型的简洁性,为了引入较少的变量个数,综合考虑之下认为最优子集为农林渔业X1,采矿业X2,制造业X3,电力燃气供应业X4,建筑业X5,房地产业X9,水利环境公共设施管理业X11,文化体育娱乐业X12,对应的R2=0.9634。
3.2 主成分分析
根据上一步得到的最优子集,含有有8个产业指标,个数较多,为了达到降维的目的,选择用主成分分析方法对8个产业指标提取主要因子。SPSS输出结果如下:
图表 2 因子方差贡献率
结果显示,有8个主成分的特征值,最大是1=4.475,最小的是8=0.084,。
方差百分比反映主成分所能解释数据变异的比例,即包含原数据的信息比例。第一个主成分的方差百分比为55.93%,含有原始8个变量接近56%的信息量;前四个主成分累计贡献率达到91.2%,故认为取前四个主成分已经足够。
图表 3 主成分特征向量
由四个特征值对应的特征向量知,四个主成分表达式分别为:
F1=0.766*X1+0.379*X2+0.863*X3+0.678*X4+0.493*X5+0.864*X6+0.885*X7+0.875*X8 F2=0.45*X1+0.873*X2-0.284*X3+0.267* X4+0.099*X5-0.403*X6-0.209*X7-0.145*X8 F3= -0.062*X1-0.034*X2-0.304*X4+0.823*X5-0.075*X6-0.239*X7+0.157*X8
F4=-0.305*X1-0.137*X2-0.274*X3+0.596*X4+0.226*X5-0.013*X6+0.081*X7-0.062*X8 (1) 在第一主成分的表达式中,X1、X3、X6、X7、X8系数较大,这5项起主要作用。我们可以把第一主成分看成是由农林渔业、制造业、房地产业、水利环境、文化体育所反映的综合指标。
在第二成分表达式中,采矿业X2的系数远大于其他指标的系数,可以看成采矿业单独对固定资产投资的影响。
在第三成分表达式中,建筑业X5远超过其他指标的影响,可以看成是建筑业单独对固定资产投资的影响。
在第四成分表达式中,电力燃气供应X4的系数大于其他指标系数,可以看成电力燃气供应对固定资产投资的影响。
3.3 主成分回归分析
用前4个主成分作为自变量对固定资产投资Y建立回归模型:
FbF Yb1122bF33b 4 F (2)
用标准化的变量观测值计算前4个主成分的得分值作为Fi的观测值(见附表)。
为了检验F1、F2、F3、F4与Y之间是否适合作回归分析,我们做了KMO检验和Bartlett球形检验。检验结果如下:
图表 4 因素分析检验
由KMO值为0.772大于0.7,而且Bartlett球形检验P值为0,都表明F1、F2、F3、F4与Y是适合进行回归分析的。SPSS回归分析结果如下:
图表 5 方差分析表
由以上方差分析表知,方程显著性检验F值为427.067,对应P值为0,表明Y关于4个主成分的回归方程是显著的。
各个主成分的回归系数的参数估计和检验结果如下:
图表 6 回归结果
首先有多重共线性检验结果知,方差扩大因子VIF都是为1,说明回归方程不存在多重共线性。
其次,由回归分析参数估计和显著性检验知,主成分回归的标准化回归方程为:
Y=0.965*F1-0.205*F2-0.056*F3-0.097*F4 (2) 为了更好地解释模型,把(1)式代入(2)式得到原始变量的回归方程: Y=0.679*X1+0.202*X2+0.917*X3+0.559*X4+0.387*X5+0.922*X6+0.902*X7+0.871*X8
由以上变换后的回归方程知,各个系数的经济意义合理,X3,X6,X7,X8的系数较大,故认为制造业、房地产业、水利环境公共设施管理业、文化体育娱乐业对固定资产投资影响相对较大。
4. 结论
本文运用主成分回归方法分析了关于各个产业对固定资产投资的影响。首先,对原始数据标准化处理以消除数量级的影响。其次,从众多的产业指标中选取最优子集,剔除了包含冗杂信息的产业指标。最后,用得到的最优子集先进行主成分分析以达到降维的目的,然后用得到的主成分关于固定资产投资进行主成分回归。研究表明,19个产业中制造业、房地产业、水利环境公共管理业、文
化体育娱乐业对固定资产投资影响相对较大,比较符合现实情况,为政府制定宏观经济政策指明了方向和提供依据。本文的不足之处在于,虽然主成分回归对排除多重共线性干扰以及简化回归方程有一定的作用,但是由于主成分是原始变量的线性组合给解释回归模型到来困难,为了解释模型,常常在得到主成分回归方程后,经常反变换为原变量的回归方程。
参 考
文 献