计量经济学软件期末作业
计量经济学软件期末作业
姓名:徐可乐 学号:20113939
计量经济学软件期末作业
学号:20113939 姓名:徐可乐
本报告数据来自IDC 、Gartner 、iCharts 官网、中国国家统计局、中国互联网数据资讯中心、百度数据研究中心以及谷歌趋势统计网站,相关网址将在附录中给出。报告以原数据为基础,经过适当调整,研究了样本期内Android 智能手机市场占有率与竞争对手苹果智能手机占有率、Android 单词全球关注度、全球手机出货量、全球智能手机出货总量、中国CPI 指数和中国移动电话用户累计增长百分点数之间的关系,探求Android 智能手机市场占有率的发展趋势。
报告采用了2009年第一季度到2013年第三季度的季度数据,共计19组数据,数据如下:
由于其中全球手机出货量与全球智能机出货量之间存在高度的相关性,因此,在本报告研究中,使用智能机在手机总出货量中所占的百分点数为一个解释变量。由此初步拟定,被解释变量为android 的市场占有率(以Y 表示),被解释变量为苹果的市场占有率(以X1表示)、android 全球关注度(以X2表示)、智能机在手机总出货量中所占的百分点数(以X3表示)、中国CPI 指数(以x4表示)和中国移动电话用户累计增长的百分点数(以X5表示)。
一、 对问题的概括性描述
从经济理论上讲,竞争对手的市场占有率与自身的市场占有率呈负相关;产品的全球关注度与产品市场占有率呈正相关;智能机在手机总出货量中的占比很大程度上影响着android 智能手机的装机量;中国作为智能机的销量大国,其消费者价格指数CPI 和移动电话用户累计增长的百分点数必将对android 的市场占有率产生较大影响。
多元线性回归模型的基本形式:设随机变量y 与一般变量x1、x2、x3、x4、x5的理论线性回归模型为:
Y=c(0)+c(1)x1+c(2)x2+c(3)x3+c(4)x4+c(5)x5+ε
其中,c(0),c(1),c(2),c(3),c(4),c(5)是6个未知参数,c(0)称为回归常数,c(1),c(2),c(3),c(4),c(5)称为回归系数。y 称为被解释变量(因变量),而x1、x2、x3、x4、x5是5个可以精确测量并可控制的一般变量,称为解释变量(自变量)。ε是随机误差,与一元线性回归一样,对随机误差项我们常假定
⎧⎪E(ε) =0
2 ⎨
σ⎪⎩var(ε) =
称
E(y)= c(0)+c(1)x1+c(2)x2+c(3)x3+c(4)x4+c(5)x5+ε
为理论回归方程。
二、描述性统计分析
1. 六变量的趋势图如下:
从图中可以看出,X2、X3与Y 趋势是一致的,增长均较快。而苹果手机的市场占有率X1波动较大,但是注意观察不难看出,与Y 呈现此消彼长的趋势。X4和x5的变化比较平缓。以上特点均符合正常的经济规律。
2.散点统计图
分析:从散点统计图上我们可以细致的来看,变量x2、x3和y 变化最为明显,可以清楚看出从2009Q1到2013Q3的19个季度中明显增长。从散点图中可以很明显的看到各季度数据随着季度的增加,x1、x4和x5的变化相对平稳。
3. 样本的相关系数
由上图可以发现,y 与 x2、x3和x5的相关系数均在0.9以上,说明这三个解释变量被解释变量有高度的线性相关性,而x1和x4与y 的相关系数较小,即线性相关性较差。除此之外,我们还可以看出x2、x3和x5三个变量之间的相关系数较大,说明可能存在多重共线问题。
三、建立计量经济模型
1. 经典线性回归模型
将原始数据导入到Eviews7.2(破解版)的数据框中,然后用Eviews 软件做线性回归分析如下:
在Eviews 主窗口菜单单击Quick/Estimate Equation,弹出方程估计窗口,再在弹出的窗口清单内填入以下回归方程的书写形式。 整形式 :
y=c(1)+c(2)*x1+c(3)*x2+c(4)*x3+c(5)*x4+c(6)*x5 简化形式 :
y c x1 x2 x3 x4 x5
这里我们采用简化形式执行后得到输出结果为:
分析:从模型汇总表中可以看出,决定系数
R
2
=0.989974,由决定系数看回归模型高度
显著。又由F=256.7375,P 值=0.000000,回归模型通过了F 检验,表明5个自变量整体对因变量y 产生显著线性影响的判断所犯错误的概率仅为0.000000。说明x1、x2、x3、x4、x5整体上对y 有高度显著的线性影响。
表中第二列是我们的回归方程参数估计值,由此可以得到y 对5个自变量的线性回归方
程为:
Y = -108.973813533 - 0.[1**********]1*X1 + 0.[1**********]8*X2 + 0.[1**********]1*X3 + 1.[1**********]*X4 + 0.[1**********]6*X5
从回归方程中可以看到,x2、x3、x4、x5对android 市场占有率起正影响,X1对android 市场占有率起负影响。从实际社会生活来看,android 关注度、智能手机出货量在手机总出货量中的占比、移动用户累计增长率的增加和居民的消费水平提高,都会促进android 市场占有率的增长,应该和android 市场占有率成正相关,而竞争对手的市场占有率x1应与android 市场占有率y 成负相关,这与定性分析的结果一致。但是,我们还需要进行更深层次的分析。
2. 尝试建立双对数模型:
很显然,结果很糟糕,所以,继续以之前建立的经典线性模型来研究。
四、回归模型的检验
1.1T 检验
分析:通过看上面的T 检验表可以发现,在显著性水平α=0.05时,只有x1和x2的Prob (收尾概率)小于0.05,通过了显著性检验。而x3、x4和x5均未通过检验,结合样本相关系数的分析,说明样本存在多重共线性。
1.2 T检验分析
为了尽可能的保留合理变量,我们就针对逐个变量给以T 检验分析,逐步剔除不合理的变量,使回归模型更完善。因此我们首先剔除Prob 最大的变量x5,再做回归分析的T 检验如下:
分析:剔除x5后,在显著性水平α=0.05时,剩余变量x1、x2、x3、x4的Prob (收尾概率)都小于0.05,T 值均大于2,全部通过了显著性T 检验。以x1、x2、x3、x4做回归分析的输出表来看,决定系数
R
2
=0.989922,由决定系数看回归模型仍然具有高度的显著性。
又由F=343.7985,P 值=0.000000,回归模型通过了F 检验,表明4个自变量整体对因变量y 产生显著线性影响的判断所犯错误的概率仅为0.000000。说明x1、x2、x3、x4整体上对y 有高度显著的线性影响。
表中第二列是我们的回归方程参数估计值,由此可以得到y 对4个自变量的线性回归方程为:
Y = -110.633354378 - 0.[1**********]3*X1 + 0.[1**********]4*X2 + 0.[1**********]1*X3 +
1.[1**********]*X4
从回归方程中可以看到,x1对android 市场占有率起负影响,x2、x3、x4对android 市场占有率起正影响,符合社会实际。
2. 1Chow断点检验
该检验的思想是对每个子样本单独拟合方程来观察估计方程是否有显著差异。零假设是两个子样本拟合的方程无显著差异。
分析:从检验表中可以看出,由于, 检验量的收尾概率分别是0.0069,0.0000,0.0000,所以回归模型接受原假设,说明模型参数有超样本特性,回归方程没有显著差异,回归模型具有稳定性。
2.2Chow 预测检验
该检验的思想,Chow 预测检验先对包含前模型对后
T 个观测值的子样本建立模型,然后用这个
1
T
2个观测值的自变量进行预测,若实际值与预测值有很大变动,就可以怀疑这两
个子样本估计关系的稳定性。
分析:从Chow 预测检验表中可以看出,检验量的收尾概率分别为0.0492,0.0001,由于0.0492可以认为相对较小,说明回归模型的预测值和实际值没有很大的波动,所以就可以认为回归模型是稳定的。
3.1异方差性的检验
我们分别以回归标准化残差和因变量y 来绘制残差图分析模型是否存在异方差。
分析:从残差的散点图上我们可以看出,回归的标准化残差随因变量y 的表变化并没有明显的规律性分布,残差图上的点都是随机散布的,无任何规律,因此我们可以初步判定回归模型不存在异方差。
3.2怀特(White )检验
怀特检验,是把
e
2
作为因变量,原先的自变量和自变量的平方项作为新自变量建立线
性回归模型,通过这个模型的拟合情况来检验是否有异方差性,检验的零假设是残差不存在
异方差性。怀特检验的统计量是LM=n ⨯度。本题的怀特检验如下:
R
2
,n 是样本观测量,
R
2
是辅助回归的拟合优
分析:上表中Obs*R-squared即为LM=n ⨯
R
2
,检验结果中由于收尾概率大于显著性
水平0.1,0.05或0.01,接收原假设,残差不存在异方差。
4自相关性的检验 4.1 LM检验
LM 检验是根据决定系数
R
2
和F 检验值的收尾概率大小来判断是否存在自相关性。原
假设:残差不存在从一阶到p 阶的自相关。检验统计量为LM=n ⨯
R
2
。
分析:从LM 检验表的收尾概率来看,prob (收尾概率)都大于0.01,F 检验的收尾概率大于0.05,但是都小于0.1, 。由此来看检验模型存在自相关。
4.2 DW检验
对于自相关性我们用DW 检验来判断,已知回归估计式的残差
∧
e
t
来定义DW 统计量,
假设有
H
:ρ=0,通过化简后DW 值与
,在Eviews 中运行ρ的关系式为DW ≈2(1-ρ)
∧
结果如下表(只选取了DW 的统计值)
分析:从表中的数据我们可以看到,DW ≈2(1-∧
ρ)=1.976386,因而可以近似的计算
∧
出
ρ=0.011807,通过查表可以判断出误差项的自相关性成轻微的正自相关(由于自相关性
4.3相关图检验
不是很明显,所以在这里就不做自相关性的消除)
同时相关图检验结果如下:
由相关图可以看出,大致上不存在一阶和高阶自相关,但是存在轻微的二阶自相关(由于自相关性不是很明显,所以在这里就不做自相关性的消除)。
5. 多重共线的诊断及优化
5.1检查共线性
1)选择Covariance Analysis的Correlation ,得到变量之间的偏相关系数矩阵,观察偏相关系数。
可以发现x2和x3的具有较高的相关系数,暗示可能存在多重共线问题。
2)进一步进行VIF 检验
可以发现Centered VIF的值中,x2和x3的值均大于10,说明存在轻微多重共线。在此,我们尝试寻找更好的拟合模型。
5.2逐步回归
将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。如下图:
可见,Y 受X2的影响最大,选择它作为初始的回归模型。
第一步:在初始模型中引入x1,模型拟合优度提高,参数符号合理,且变
量通过了t 检验,D.W. 检验值落在上界附近;
第二步:引入x3,x3未通过T 检验;
第三步:去除x3,引入x4,x4未通过T 检验;
故最终的拟合模型为:
Y = 16.687108144 - 1.[1**********]*X1 + 0.[1**********]1*X2
此时的VIF 检验如下:
可以发现Centered VIF的值中,x1和x2的值均远小于10,说明已经较好地解决了多重共线问题。
五、回归模型总结
1. 总结
在初步建模阶段,我们得到如下的方程:
Y = -110.633354378 - 0.[1**********]3*X1 + 0.[1**********]4*X2 + 0.[1**********]1*X3 +
1.[1**********]*X4
方程的相关系数符合经济意义,但是在接下来的检验中,发现这个模型的四个变量间存在多重共线性,因此,对其进行进一步优化,最终得到如下的模型:
Y = 16.687108144 - 1.[1**********]*X1 + 0.[1**********]1*X2
由此不难看出,影响android 市场占有率的主要因素有两个,即竞争对手苹果手机的市场占有率以及人们对android 这一手机系统的关注度。
2.感想
随着社会经济的不断发展,科学技术的不断进步,计量方法越来越成为人们必不可收的工具盒手段。学习金融学,很有必要掌握一定的计量分析技能。
通过问题分析及假设建立了初步多元线性回归,再借用Eviews 软件对数据进行了初步的预处理分析,得出数据符合做多元线性回归。的要求。最后我们用Eviews 软件给各变量做了初等多元线性回归并得到了回归方程。为了更多的了解多元线性回归方程的特征,我们对回归方程进行了F 检验,T 检验,将通过T 检验的变量在建立回归方程分析。对于初等回归模型的稳定性,我们采用了Chow 断点检验和Chow 预测检验,最终检验出了模型是稳定的。然后又对初等模型否违背原假设做了异方差性检验,自相关性检验。异方差性的检验我们采用了作残差图和怀特检验法,很好的检验出了初等回归模型没有异方差性;自相关我们采用了DW 检验,最终检验出了初等模型有轻微的负自相关性。并且在分析中我们发现了变量之间存在共线性,因此我们又进一步选择Covariance Analysis 的Correlation 和VIF 检测对变量之间的多重共线性给了诊断,最后确定了确实存在多重共线性,从而又进一步对多重共线性给予了消除,重新建立了符合实际的线性回归方程。
附录:
IDC:
国家统计局:
中文互联网资讯中心:
百度文库: