[经济管理定量分析高级方法]实验指导书
《经济管理定量分析高级方法》
实 验 指 导 书
康继军 编
重庆大学经济与工商管理学院
2007 年 7 月
目 录
实验1 非线性回归模型估计„„„„„„„„„„„„„„„„„„„„„(2) 实验2 工具变量估计与虚拟变量应用„„„„„„„„„„„„„„„„„(9) 实验3 模型诊断与检验方法„„„„„„„„„„„„„„„„„„„„(15) 实验4
时间序列估计实验„„„„„„„„„„„„„„„„„„„„„(22)
实验1 非线性回归模型估计实验
一、实验目的
通过本次实验,学会使用两种非线性回归模型的估计方法:(1)通过线性化的方式估计非线性回归模型;(2)直接估计非线性回归模型。 二、实验安排
1.学时: 本实验安排4个学时,主要用于完成实验及实验报告。 2.时间: 由实验室统一安排 3.地点: 由实验室统一安排 三、实验原理、内容、方法和步骤: (1).实验要求
1.通过实例演示,学会使用两种非线性回归模型的估计方法; 2.熟悉使用EVIEWS软件进行非线性回归模型估计的操作方法; (2).实验内容
某硫酸厂生产的硫酸的透明度指标一直达不到优质的要求,经过分析透明度低与硫酸中的金属杂质含量太高有关。影响透明度的主要金属杂质是铁、钙、铅、镁等。通过正交试验的方法发现铁是影响硫酸透明度的最主要原因。测量了47组样本值,数据如表1-1,硫酸透明度(y)与铁杂质含量(x)的散点图如图1-1,应该建立非线性回归模型。
表1-1硫酸透明度(y)与铁杂质含量(x)数据
图1-2硫酸透明度(y)与铁杂质含量(x)散点图
1.通过线性化的方式估计非线性回归模型 先建立倒数模型。
首先建立工作文件。从工作文件主菜单中点击Quick键,选择Estimate Equation功能,在弹出的对话框的Equation Specification(方程设定) 选择框输入
1/y c 1/x
点击OK键,得到估计结果如图1-2,对应的表达式是: 1/Y = 0.[1**********] - 2.372132322*1/X t-value (18.6)*** (-11.9) *** R2=0.76, s.e.=0.009, F=143 可决系数R2=0.76。
图1-2
实际上,如果建立指数函数,拟合的效果会更好。打开方程设定(Equation specification)对话框,输入估计命令,
log(y) c 1/x
点击OK键,得到估计结果如图1-3,对应的表达式是: LOG(Y) = 1.993732697 + 104.5194751*(1/X) t-value (21.97)*** (21.64) *** R2=0.91, s.e.=0.22, F=468, 把表达式还原为指数形式,
Lny=Ln(7.33)+104.5(1/x) 式(1.1) y = 7.33e105.5(1/x)
可决系数R2由0.76提高到0. 91,可见拟合为指数函数比倒数函数效果好。
图1-3
散点图与拟合的指数曲线见图1-4.
with Regression功能(见图1-5).
EViews的操作步骤是,打开x,y数据组窗口,点击View键,选Graph/Scatter/Scatter
图1-5
在随后弹出的对话框中y和x选对数和倒数形式(如图1-6),点击OK,就得到了图1-4.
图1-6
注意,对数变量和倒数变量也可以通过生成新序列的方式定义新的变量,然后用新
变量进行估计,回归结果是一样的,例如把对数变量log(y)定义成Lny,倒数变量1/x定义为z,这样估计命令为:
Lny c z
这一估计命令不如原估计命令“log(y) c 1/x”好,因为在预测时,前者只能得到Lny的预测值,而后者即可以得到Lny的预测值,也可以得到y的预测值,而我们通常更关心y的预测结果。
2.直接估计非线性回归模型
EViews的估计方法是直接书写非线性形式的命令,操作步骤如下。
从工作文件的主菜单从工作文件主菜单中点击Quick键,选择Estimate Equation功能,在弹出的对话框的Equation Specification(方程设定) 选择框输入指数形式的估计命令:
Y=c(1)*EXP(C(2)*(1/X))
如图1-7所示。其中C(1)、C(2)表示被估参数,EXP(.)表示指数函数形式。
图1-7
在Method(估计方法)对话框内默认的选择就是LS - Least Squares (NLS and ARMA),其中NLS表示非线性最小二乘估计,即直接采用非线性函数回归形式估计参数。
点击OK键,输出结果如图1-8.
图1-8
对应的非线性估计结果是:
1100.1()
x
***
2
y8.2965e
***
式(1.2)
t (11.0)(29.4) R0.96, s.e.9.9
式(1.2)比式(1.1)的估计结果更好,因为可决系数R2由0.91提高到0.96。当x=82时,y的预测值为28.11.
实验2 工具变量估计与虚拟变量应用实验
一、实验目的
通过本次实验,掌握工具变量估计方法和虚拟变量的应用方法。 二、实验安排
1.学时: 本实验安排4个学时,主要用于完成实验及实验报告。 2.时间: 由实验室统一安排 3.地点: 由实验室统一安排 三、实验原理、内容、方法和步骤 (1).实验要求
1.通过实例演示,学会使用工具变量估计方法和虚拟变量的应用方法; 2.熟悉使用EVIEWS软件进行工具变量估计和虚拟变量应用的操作方法; (2).实验内容
参照下面的实验方法和步骤,进行工具变量估计和虚拟变量的应用操作,并得出结果。
(3).实验方法和步骤
1. 工具变量估计:
1978~1998年中国国内生产总值GDPt 、宏观消费CONSt 、资本形成总额CAPIt数据见表2-1.
表2-1 GDP
数据 (单位:亿元)
《经济管理定量分析高级方法》实验指导书
建立宏观消费模型:
CONSt0tGDPtut 得到估计结果如下:
CONSt620.64140.5730GDPt
(6.6) (213.2) R0.9996,DW0.80
2
模型中宏观消费CONSt是随机变量。因为CONSt是国内生产总值GDPt的一部分,所以GDPt也应该是随机变量,这就违反了模型中解释变量非随机的假定。而且GDPt也必然与ut高度相关,估计结果还显示模型存在严重的自相关,所以应该选择一个工具变量设法替代变量GDPt。
资本形成总额CAPIt是GDPt的一部分,与GDPt高度相关。经过计算,以上模型的残差与CAPIt的相关系数为-0.03,这在一定程度上说明了CAPIt与ut不相关。基于上述理由,选择CAPIt做GDPt的工具变量。
具体操作方法:
从EViews主菜单中点击Quick键,并选择Estimate Equation功能,打开Equation Specification(模型设定)对话框。点击Method窗口,选择TSLS(两阶段最小二乘)估计方法,如图2-1.
图2-1
《经济管理定量分析高级方法》实验指导书
点击OK键,从而打开如图2-2的对话框,在Equation Specification选择区输入命令:cons c gdp
其中cons表示CONSt,c表示截距项,gdp表示GDPt。在Instrument list(列写工具变量)选择区输入命令:c cpi
表示用CAPIt和c(截距项)做工具变量(c可以省略不写,EViews程序会自动加入)。点击OK键,得到结果如图2-3.
图2-2
图2-3
因此相应的回归式是:
CONSt630.29610.5726GDPt
(6.7) (212.5) R0.9996,DW0.80
***
***
2
630.2961和0.5726分别是0和1的工具变量法估计值。
2. 虚拟变量的应用:
1982:1~1985:4中国季度酒销量(yt,万吨)数据如表2-2,序列见图2-4.这是一个季度时间序列数据,呈明显的季节变化特征,建立模型时应该加入季节虚拟变量以反映季节特征。
表2-2 全国酒销量(y
,万吨) 季度数据
图2-4
EViews中有专门定义季节虚拟变量的命令,操作如下:
从工作文件主菜单中点击Quick键,选Generate Series功能,如图2-5,在弹出的对话框中填入D1=@seas(1),如图2-6,定义虚拟变量D1,
1,t第一季度
D1
0,t第一季度
D1的具体取值见表2-2. 同理可定义虚拟变量D2和D3。
图2-5
图2-6
执行EViews估计命令: y c @trend(1982.1) d1 d2 d3 估计结果见图2-
7.
图2-7
从图2-7可以看出,D2、D3的回归参数没有显著性,说明不需要把第2季度和第3季度单独分类。从模型中删除这两个变量,执行估计命令:
y c @trend(1982.1) d1 估计结果如图2-
8.
图2-8
相应的估计式是:
yt80.941.28t15.42D1
***
***
***
(48.5)(7.3) (8.3) R20.89, s.e.3.16, F52, 1982年第2季度令为t=1.
回归结果表明对于该组数据,只需要把第一季度区别于其他3个季度就可以了。如果感觉DW值比较小,可以采用进一步的方法提高DW值,例如:
图2-9
实验3 模型诊断与检验方法实验
一、实验目的
通过本次实验,熟悉和掌握4种模型诊断与检验方法:CHOW突变点检验;CHOW模型稳定性检验;似然比检验;WALD检验。 二、实验安排
1.学时: 本实验安排4个学时,主要用于完成实验及实验报告。 2.时间: 由实验室统一安排 3.地点: 由实验室统一安排 三、实验原理、内容、方法和步骤 (1).实验要求
1.通过实例演示,掌握4种模型诊断与检验方法:CHOW突变点检验;CHOW模型稳定性检验;似然比检验;WALD检验;
2.熟悉使用EVIEWS软件进行掌握4种模型诊断与检验方法的操作方法; (2).实验内容
参照下面的实验方法和步骤,进行4种模型诊断与检验方法的应用操作并得出结果。 (3).实验方法和步骤
1. 邹突变点检验(Chow Breakpoint Tests)
邹突变点检验由邹至庄1960年提出,用于检验模型参数在样本范围内某一点是否发生变化。
1985~2002年中国家用汽车拥有量(yt,万辆)与城镇居民家庭人均可支配收入(xt,元),数据见表3-1.
图3-1
图3-1是关于yt 和xt的散点图,从图中看1996年应该是一个突变点。当城镇居民人均可支配收入突破4838.9元之后,城镇居民家庭购买家用汽车的能力大大提高。现在用邹突变点检验法检验1996年是否是一个突变点。
原假设是两个子样本(1985~1995年,1996~2002年)相对应的模型回归参数相等,备择假设是两个子样本对应的回归参数不相等。在1985~2002年样本区间作如下回归,
y c x
点击回归结果窗口中的View键,选Stability tests/Chow Breakpoint Test功能,如图3-2.
图3-2 图3-3
在随后弹出的对话框中填入1996(如图3-3),点击OK键,得到检验结果如图3-4.因为F=2720.7远远位于临界值的右侧,所以推翻原假设,结论为1996年是突变点。
图3-4
2. 邹模型稳定性检验(Chow Forecast Test)
仍然使用表3-1的数据,在用1985~1999年数据建立的模型基础上,检验当把2000~2002年数据加入样本后,模型的回归参数是否出现显著性变化。
由于已知1996年为结构突变点,所以设定虚拟变量,
1985~19950,
D1
1,1996~2002
以区别两个不同的时期。用1985~2002年数据按以下命令回归, y c x d1 x*d1
在回归结果窗口中点击View键,选Stability tests/Chow Forecast Test功能,如图3-5.
图3-5 图3-6
在随后弹出的对话框中填入200 2001 2002(如图3-6).点击OK键,得到的检验结果如图3-7.
图3-7
由于F值对应的概率为0.73,说明F=0.43,位于临界值左侧(原假设接受域),所以接受原假设,结论为模型加入2000,2001,2002年的样本值后,回归参数没有发生显著性变化。
3. 似然比检验(LR Test)
似然比检验、wald检验、拉格朗日乘数检验都基于MLE(Maximum likelihood
estimation:极大似然估计),就大样本而言三者是渐进等价的。
1)、似然比检验的思想是:如果参数约束是有效的,那么加上这样的约束不应该引起似然函数最大值的大幅度降低。
也就是说似然比检验的实质是在比较有约束条件下的似然函数最大值与无约束条件下似然函数最大值。似然比定义为有约束条件下的似然函数最大值与无约束条件下似然函数最大值之比。以似然比为基础可以构造一个服从卡方分布统计量(具体形式参见Greene)。
2)、wald检验的思想是:如果约束是有效的,那么在没有约束情况下估计出来的估计量应该渐进地满足约束条件,因为MLE是一致的。
以无约束估计量为基础可以构造一个Wald统计量(具体形式参见Greene),这个统计量也服从卡方分布;
3)、拉格朗日乘数检验(LM)的思想是:在约束条件下,可以用拉格朗日方法构造目标函数。如果约束有效,则最大化拉格朗日函数所得估计量应位于最大化无约
束所得参数估计值附近。
这里也是构造一个LM统计量(具体形式参见Greene),该统计量服从卡方分布。 对于似然比检验,既需要估计有约束的模型,也需要估计无约束的模型;对于Wald检验,只需要估计无约束模型;对于LM检验,只需要估计有约束的模型。一般情况下,由于估计有约束模型相对更复杂,所以Wald检验最为常用。对于小样本而言,似然比检验的渐进性最好,LM检验也较好,Wald检验有时会拒绝原假设,其小样本性质不尽如人意。 例:
有中国国债发现总量(DEBTt,亿元)模型如下:
DEBTt01GDPt2DEFt3REPAYtut 式(3-1) 其中GDPt表示年国内生产总值(百亿元),DEFt表示年财政赤字额(亿元),REPAYt表示年还本付息额(亿元),用1980~2000年的数据,见表3-2得到估计结果如图3-8.
表3-2 国债发行总量(DEBTt)、GDPt、财政赤字(DEFt)、年还本付息(REPAYt)数据
年份 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001
DEFt(亿元)
43.01 121.74 83.86 79.41 77.34 89.85 138.25 223.55 270.78 407.97 375.45 461.4 669.68 739.22 1175.25 1549.76 1967.28 2476.82 3310.93 3715.03 4180.1 4604
GDPt(百亿元)
45.178 48.624 52.947 59.345 71.71 89.644 102.022 119.625 149.283 169.092 185.479 216.178 266.381 346.344 467.594 584.781 678.846 744.626 783.452 820.6746 894.422 959.333
DEFt(亿元)
68.9 -37.38 17.65 42.57 58.16 -0.57 82.9 62.83 133.97 158.88 146.49 237.14 258.83 293.35 574.52 581.52 529.56 582.42 922.23 1743.59 2491.27 2516.54
REPAYt(亿元)
28.58 62.89 55.52 42.47 28.9 39.56 50.17 79.83 76.76 72.37 190.07 246.8 438.57 336.22 499.36 882.96 1355.03 1918.37 2352.92 1910.53 1579.82 2007.73
图3-8
在用似然比(LR)统计量检验约束GDPt对应回归系数1等于零是否成立。检验过程是:在输出结果图3-8窗口中点击View键,选Coefficient tests/Redundant Variables-Likelihood Ratio功能,如图3-9.在随后弹出的对话框中填入GDP(如图3-10),点击OK键,得到检验结果如图3-11.
图3-9 图3-10
图3-11
输出结果的上部给出了关于约束GDP系数为零的F检验和LR检验两种结果,因为相应概率均小于0.05,表明F和LR统计量的值都落在了相应的临界值的右边,即原假设的拒绝域,所以结论是:GDP系数1为零的约束不成立。模型中应该保留解释变量GDP。
图3-8给出的是非约束模型的估计结果,图3-11的下半部分的回归是约束模型(去掉了GDP变量)的估计结果。
这一检验也可以以图3-11下部的回归为基础做,检验路径是,在回归窗口中点击View键,选Coefficient tests/Omitted Variables-Likelihood Ratio 功能,在随后弹出的对话框中也填入GDP,则检验结果与图3-11的上部结果相同。
第一种方法是以非约束模型为基础做LR检验,第二种方法是以约束模型为基础做LR检验。
注意:似然比(LR)统计量只能检验线性约束。 4. Wald检验
仍然以表3-2的数据为例介绍EViews的Wald检验。在输出结果图3-8窗口中点击View键,选Coefficient tests/Wald-Coefficient Restrication功能,如图3-12.然后在随后弹出的对话框中填入
3*c(2)=c(3),如图3-13.
图3-12 图3-13
其中c(2)代表GDPt的回归参数,c(3)代表DEFt的回归参数.点击OK键,得到结果如图3-14.
图3-15
输出结果的上部给出了关于约束条件3*c(2)=c(3)是否成立的Wald检验结果,其中包括F和LR两个统计量。因为相应的概率都大于0.05,表明F和LR统计量的值都落在了相应临界值的左边,济原假设的接受域,所以结论是,约束条件3*c(2)=c(3)成立,2是
1的3倍。
图3-15的下部给出约束条件3*c(2)-c(3)=0的样本值和样本标准差。
实验4 时间序列估计实验
一、实验目的
通过本次实验,要求掌握以下内容:画时间序列图;求时间序列的相关图和偏相关图,识别模型形式;时间序列模型估计;样本外预测。 二、实验安排
1.学时: 本实验安排4个学时,主要用于完成实验及实验报告。 2.时间: 由实验室统一安排 3.地点: 由实验室统一安排 三、实验原理、内容、方法和步骤 (1).实验要求
1.通过实例演示,掌握时间序列模型的基本估计方法;
2.熟悉使用EVIEWS软件进行掌握时间序列模型估计的操作方法; (2).实验内容
参照下面的实验方法和步骤,进行时间序列模型估计的应用操作,并得出结果。 (3).实验方法和步骤
本实验以1949~2001年中国人口时间序列数据(表4-1)为例。
1. 画时间序列图
打开工作文件窗口,双击所要选择的中国人口变量yt,从而打开yt的数据窗口。点击View键,选择Graph/Line功能(如图4-1),就可以得到中国人口时间序列图,如图
4-2
图4-1
图4-2
从EViews主菜单中点击Quick键,选择Graph / Line Graph功能(见图4-3),在随后弹出的对话框中填入d(y),点击OK键,就可以得到中国人口差分序列图 (见图4-4).
图4-3 图4-4
从人口序列图和人口差分序列图可以看出我国人口总水平除在1960年和1961年两年出现回落外,其余年份基本保持线性增长趋势。52年间平均每年增加人口1412.6923万人,年平均增长率为16.6‟。由于总人口数逐年增加,实际上的年人口增长率是逐年下降的。把52年分为两个时期,即改革开放以前的时期(1949~1978年)和改革开放以后时期(1979~2001年),则前一个时期的人口年平均增长率为20.0‟,后一个时期的年平均增长率为12.3‟,从人口序列yt的变化特征看,这是一个非平稳序列。
2. 求中国人口序列的相关图和偏相关图,识别模型形式
在中国人口序列yt数据窗口中点击View键、选择Correlogram功能(见图4-5),可以得到对话框(见图4-6).其中包括两种选择:①对原变量(Level)还是对其一阶差分变量(1st difference)、二阶差分变量(2nd difference)求相关图。此项的默认选择是Level。对于本例,选择Level,即选择对yt画相关图、偏相关图。②另一项选择是确定相关图的滞后期(Lags to include),这里选择的是10.
点击OK键,可以得到yt的相关图、偏相关图(如图4-7).图的左侧给出的是yt的相关图、偏相关图,右侧给出的是相对于每一个滞后期的估计的自相关系数和偏相关系数值。Q-Stat所对应的列是相应自由度的Q统计量的值。最右侧Prob列的数字表示相应自由度条件下2统计量取值大于相应Q值的概率。
图4-5 图4-
6
图4-7
在图4-6中选择一阶差分变量(1st difference),可以得到dyt的相关图、偏相关图(见图4-
8).
图4-8
由图4-7中相关图衰减的很慢,知道中国人口序列yt是非平稳序列,而图4-8中相关图呈现指数衰减特征可知dyt是平稳序列。通过初步分析,认定dyt是一个1阶或2阶自回归过程。假定先估计AR(2)模型。
3. 时间序列模型估计
从EViews主菜单中点击Quick键,选择Estimate Equation功能,在随即弹出Equation specification对话框中输入AR(2)模型估计命令如下:
D(Y) c AR(1) AR(2)
将样本区间改为1949~2000年,留下2001年的值用于计算预测精度。点击OK键,可得到估计结果如图4-9所示。
图4-9
由于AR(2)项,即Dyt-2的系数不显著,,因此点击Estimate键,从估计命令中剔除AR(2)项继续估计,则得到估计结果如图4-
10.
图4-10
对应的模型表达式为: Dyt0.1429ut
(8.7)***
ut0.6171ut1t (5.4)***
或者直接写为:
Dyt0.14290.6171(Dyt10.1429)t (8.7)*** (5.4)***R20.38
输出结果中的0.1429是Dyt的均值,表示年平均人口增量是0.1429亿人。 整理上述输出结果得到:
Dyt0.1429(10.6171)0.6171Dyt1t
0.05470.6171Dyt1t
漂移项0.0547,表示线性趋势的增长速度。
从图4-10输出结果的最后一行知,特征根是1/0.62=1.61,满足平稳性要求。点击View选择Residuals Tests/Correlogram-Q-Statistics功能,如图4-11,可以得到如图4-12的对话框,选择滞后期为10,点击OK键,可得到如图4-13的结果。
图4-11 图4-12
图4-13
由于右侧一列概率值都大于0.05,说明所有的Q值都小于检验水平为0.05的2分布临界值(位于临界值左侧)。结论应该是,模型的随机误差项是一个白噪声序列。
通过图4-13窗口的功能键,可以得到其他的表达形式。例如,点击View键,选择Actual,Fitted,Residual/Actual,Fitted,Residual Talbe功能(如图4-14所示),就会得到如图4-15所示的残差值序列和残差图:
图4-14
图4-15
此外,还可以通过方程窗口(Equation)的View功能查看模型结构(ARMA Structure)。点击View键选ARMA Structure功能得到图4-16的对话框,可以用图形(Graph)或表格(Table)两种形式查看估计模型的特征根(roots)、相关图(correlogram)、脉冲响应(impulse response)等。例如在图4-16的输入状态点击OK键,得到估计结果(图4-10)对应的理论设定与实际的自相关函数与偏自相关函数图,如图4-17.
图4-16
图4-17
垂直线(蓝线)表示用样本数据得到的相关图和偏相关图,连续(红)曲线表示设定模型对应的相关图和偏相关图,从而可以查看设定模型和样本的拟合程度。
4. 样本外预测
使用估计出的模型
Dyt0.05470.6171Dyt1t
来预测中国2001年的总人口,在图4-10窗口中点击forecast键,弹出对话窗口。在S.E.(optional)选择区填入yfse,把Forecast sample(预测样本区间)改为2001~2001,预测方法(Method)选择静态预测(Static),如图4-11.
图4-11
点击OK键,预测结果就会以yf和yfse为变量名保存在工作文件中,打开y、yf、yfse数据组如图4-12.2001年中国人口12.78806亿人,其标准差为0.045.
图4-12
由于已知2001年中国人口的实际数为12.76270亿人,所以预测误差为:
12.788112.76270.002 12.7627
类似,可以做2001年的动态预测(Dynamic),也是这个结果。如果预测2002年以后的各年度人口值时,动态预测与静态预测的值将会不同。
附录:
《经济管理定量分析高级方法》
实 验 报 告 书
实验题目:
姓 名: 学号:
年级、专业、班
实验地点:
完成时间:
教师评语:
教师(签名)
成 绩: 阅批时间
实验报告的内容
学生在实验之后应该按照以下内容撰写实验报告:
一、实验目的
二、实验原理
三、实验内容
四、实验步骤
五、实验的原始记录及其处理(数据、图表、计算等)
六、实验结果及分析
实验报告打印要求
1.按照给定的“实验报告书”封面格式,填写完整后打印
2.正文版式
开 本:A4
页 边 距:上:2.4;下:2.0;左:2.4;右:2.4;页眉:1.8;页脚:1.8 正文用字:五号宋体,单倍行距;
一级标题:小四号宋体,左对齐,上下各空0.5行
二级标题:五号黑体,左对齐,独立一行,下文另起行
3.左边装订