面板数据(相关软件使用方法)
相关软件使用方法
EViews 对Panel Data模型的估计是通过含有Pool 对象的工作文件和具有面板结构的工作文件来实现的。处理时间序列/截面数据的EViews 对象称为Pool 。通过Pool 对象可以实现对各种变截距、变系数时间序列模型的估计,但Pool 对象侧重分析“窄而长”的数据,即截面成员较少而时期较长的侧重时间序列分析的数据。对于截面成员较多时期较少的“宽而短”的侧重截面分析的数据,一般都是通过具有面板结构的工作文件(Panel workfile)来进行分析的。利用面板结构的工作文件可以实现变截距时间序列/截面数据模型以及动态时间序列/截面数据模型的估计。
含有Pool 对象的工作文件
Pool 对象在EV iews 中扮演着两种角色。首先,Pool 对象中包含了一系列的标识名,这些标识名描述了工作文件中的合并时间序列/截面数据的结构。在这个角色中,Pool 对象在管理和处理合并数据上的功能与组对象有些相似。其次,利用Pool 对象中的过程可以实现对含有各种时间序列/截面数据模型的估计及对估计结果的检验和处理。在这个角色中,Pool 对象与方程对象有些相似。
Pool 对象的核心是建立用来表示截面成员的名称表。为明显起见,名称要相对较短。例如,在本章所介绍的案例中,15个地区作为截面成员,用AH表示安徽省,用BJ表示北京等。定义了Pool 的截面成员名称就相当于将数据结构告诉了EViews ,EViews 会自动把这个Pool 理解成对每个地区使用单独的时间序列。
1.创建Pool 对象
在此我们以本章中研究企业投资需求的时间序列/截面数据模型为例,介绍Pool 对象的创建过程。 要创建Pool 对象,选择Objects/New Object/Pool…,并在如图20所示的编辑窗口中输入截面成员的识别称:AH 、BJ 、FJ 、HB 等 。值得注意的是,一个Pool 对象只是对数据结构的一种基本描述,其本身并不包含序列和数据。
图20 Pool 对象的说明窗口
2. Pool 数据
正如前面所强调的,所有的Pool 数据都被存放在普通的EV iews 序列中,这些序列可以按通常方式使用:可以列表显示,图形显示,产生新序列,或用于估计。同时也可以使用Pool 对象来处理各单独序列。在含有Pool 对象的工作文件中有两类序列:普通序列和截面成员特有序列。
(1) 普通序列
普通序列指的是其某一时期的数据值对各截面成员都是相同的。我们可以用单独的一个序列来存放变量的数据,每个截面成员都可以使用这一序列中的数据。例如,在一个包含由多个企业构成的Pool 对象的工作文件中,关于宏观经济状况的变量,像GDP 和货币供应量这些宏观经济指标,在某一时期对各个企业来说都是不变的,因此,需要用两个单独的序列来分别存放GDP 和货币供应量的数据。由于普通序列与截面成员无关,因此,可以不用参照Pool 对象对其进行定义
(2)截面成员特有序列
截面特有序列指的是此类序列的数据对不同的截面成员是不相同的。对于同一个变量的不同截面成
员的数据被存放在不同的序列中,序列是变量信息和截面成员信息的融合。
由于截面特有序列是与截面成员相对应的,因此,这列序列的定义应该是与Pool 对象中截面成员识别名对应的。例如,在本章案列中,Pool 对象中的截面成员为:“AH ”、“BJ ”、“FJ ”等,并且有各截面成员的消费收入数据,因此在工作文件中应该建立15个分别对应各个截面成员数据序列。给截面特有序列命名的关键是:使用基本名和截面识别名称组合命名。截面识别名称可以放在序列名中的任意位置,只要保持一致即可。
(3)Pool 序列
一个Pool 序列实际就是一组序列, 序列名是由基本名和所有截面识别名构成的。Pool 序列名使用的是基本名和“?”占位符,其中“?”代表截面识别名。如果序列名为CPAH 、CPBJ 、CPFJ 等,则相应的Pool 序列为CP? 。当使用一个Pool 序列名时,EViews 默认为准备使用Pool 序列中的所有序列。EViews 会自动循环查找所有截面识别名称并用识别名称替代“?”,然后EV iews 就会按指令使用这些含有截面成员识别名的替代后的序列名称。
3. Pool 对象的模型估计
单击Pool 工具栏的Estimate 选项或在Pool 对象的菜单中选择Proc/Estimate…打开如图21所示的“Pool 对象方程估计”对话框。在该对话框中有如下几项设置:
图21 Pool 对象方程估计对话框
(1) 因变量——Dependent Variable
在因变量对话框中输入Pool 变量或Pool 变量表达式。
(2) 样本
在最下方的编辑窗口中输入样本说明。样本的缺省值是各截面成员中的最大样本值。如果得不到某时期截面成员的解释变量或因变量的值,那么此观测值会被排除掉。
复选框Balanced Sample说明在各截面成员间进行数据排除。只要某一时期数据对任何一个截面成员无效,此时期就被排除。这种排除保证得到的样本区间对所有截面成员都是有效的。
如果某截面成员的所有观测值都没有,那么Pool 在进行估计时就排除这个截面成员。同时EViews 会在输出中提示漏掉的截面成员。
(3) 解释变量
在指定解释变量时,需要在三个编辑框中分别输入相应的解释变量。
① Common coefficients:——此栏中输入的变量对所有截面成员有相同的系数,而各变量的系数则不同,并用原有的变量表示输出结果。
② Cross-section specific coefficients:——此栏中输入的变量对Pool 中每个截面成员的系数不同。EViews 会对每个截面成员估计不同的系数,并以截面成员识别名和一般序列名复合的形式输出结果。
③ Period specific coefficients:——此栏中输入的变量在各观测时期的系数不同。EViews 会对各观
测时期估计不同的系数,并以时期识别名和一般序列名复合的形式输出结果。
注意,对截面成员或时期特定系数模型进行估计会生成很多系数,如果是截面成员特有系数模型,则估计生成的系数个数就等于Pool 中截面成员数和所列变量数的乘积;如果是时期特有系数模型,则估计生成的系数个数就等于回归样本时期数和所列变量数的乘积。
注意的是EViews 中的Pool 对象只能依据编辑框中的变量说明进行一般的线性估计,如果要进行非线性估计,必须首先建立一个系统对象,并进行相应的系统说明。
(4) 估计形式设定
在估计方式“Estimation method”部分,我们可以对估计形式进行设定。通过固定或随机影响(Fixed and Random Effects )的设定,可以对各截面单位或各时期的影响进行描述。EViews 默认的是没有影响,即相应的各选项的初始给定状态为“None ”,我们可以根据设定的需要在下拉菜单中选择相应的固定“Fixed ”或随机“Random ”影响状态。但是,目前还不能用截面成员特定系数,AR 项或者加权进行随机影响模型估计。
需要指出的是,在选择固定或随机影响时,EViews 在估计时会自动在相同系数变量一栏中加入一常数项,从而确保所有影响之和为零。即Eviews 给出的是不含总体均值的个体影响,其反映的是各截面个体对总体平均状态的偏离。
(5) 权重
在Pool 方程估计中,缺省值为没有加权,但是可以选择加权项。有五种权重选择:
如果选择Cross section weights,EViews 会假设出现截面异方差,对模型进行广义最小二乘估计。如果选择Cross —section SUR ,EViews 会假设出现截面异方差和同期相关,对模型进行相应的广义最小二乘估计。类似地,如果选择Period weights,EV iews 会假设出现时期异方差,从而对模型进行相应的广义最小二乘估计,选择Period SUR,EViews 会进行相应的广义最小二乘估计修正时期异方差和同期相关。
(6)估计方法
在这里所提供的估计方法主要有两种:“LS-Least Squares(and AR) ”——最小二乘法、“TSLS-Two-Stage Least Squares(and AR)”——二阶段最小二乘法(工具变量)。如果选择后一估计方法,会出现相应的描述工具变量的对话框。
对应于回归形式设置,工具变量列表也分为三部分:相同工具变量栏(Common )、截面成员特有工具变量栏(Cross-section )和时期特有工具变量栏(Period ),关于各栏中变量的解释同回归设定中相同。对于截面成员特有工具变量,其个数应该等于截面成员数与列表中的变量数的乘积;对于时期特有工具变量,其个数应该等于样本时期数与列表中变量数的乘积。
如果估计方程中含有AR 项,那么将显示最下面的复选框“Include lagged regressors for equations with AR terms ”。默认情况下是选定该复选框的,即将因变量和解释变量的滞后变量加入到工具变量的中。当然我们也可以根据需要不选择此复选框。
Panel 结构的工作文件(Panel Workfile)
当时间序列/截面数据的截面成员较多时期较少时,一般都是侧重进行截面分析。我们可以通过EViews 中的面板工作文件(Panel workfile )对于这种“宽而短”的数据进行处理和建模分析。利用面板工作文件可以实现固定影响、随机影响以及各种动态变截距时间序列/截面数据模型的估计。
在Panel 结构工作文件中,数据是以堆积的形式存放的,故称其为堆积Panel Data。处理堆积Panel Data 的第一步就是要描述数据的Panel 结构,我们称这步为:构建工作文件。当工作文件被设定为一
个面板工作文件时,便可以利用EViews 所提供的处理面板数据的工具对各种模型进行相应的估计。
1. 构建面板工作文件
在对Panel Data进行分析之前需要先进行数据Panel 结构的定义,通过定义可以使得堆积数据中的每个观测值相对其对应的截面成员均是可识别的,同时在定义中还要指定工作文件后推和前导选定数据的方法。
Panel 结构工作文件主要有两种创建方式。一种方式是在EViews 的主菜单下选择File/New/Workfile…打开“工作文件建立”对话框,在其中的“工作文件结构类型”的下拉列表中选择“平衡面板(Balanced Panel)”项,之后对其它项进行相应的设置,单击“OK ”之后,EViews 便会建立一个具有合适结构的Panel 工作文件。另
一种构建Panel 工作文件的方法,是通常情
况下经常使用的方法,即先将堆积数据导入
到一个未指定结构的工作文件中,然后再对
该文件进行相应的Panel 结构设定。为了让
大家更好地理解这种Panel 工作文件的构建
方法,此处将举例介绍构建过程。在本章例
子中,我们有29个省市的13年的城镇居民
消费和收入数据,这些数据构成了一个平衡
的Panel 结构。为了构建相应的面板工作文
件,我们可以先将这些数据导入到一个含有
377个观测值的未指定结构的工作文件中,
并在工作文件中建立序列YEAR 和序列图7.3 未指定结构的工作文件窗口
FCODE ,同时使得这两个序列中的值可以用来识别每个观测值所对应的时期和截面成员。
通过双击工作文件上方的“Range ”行或选择Poc/WF Structure&Range…可以打开如图7.4所示的“工作文件结构”对话框,并在工作文件结构类
型中选择时期面板(Dated Panel)。然后,
在时期序列和截面序列编辑框中分别输入
相应的序列名——year 和fcode 。由于数据
满足平衡要求,这样对其它设置项便无需设
置了。
单击“OK ”后,EViews 便会根据对所
指定的时期序列和截面序列的分析给工作
文件设定合适的结构。在这个过程中,系统
依照截面识别序列和时期序列的信息,将工
作文件中原有的数据进行分类,从而使工作
文件具有适当的Panel 结构。
2. 面板工作文件视图
与普通工作文件相比面板工作文件的视图主要有两个突出的变化:工作文件最上方的关于数据区间和样本区间信息显示的变化以及识别各观测值的标签的变化。
(1)数据和样本区间
面板工作文件在视图方面的一个主要变化体现在工作文件窗口最上方的数据和样本区间描述上。
EViews 在时期面板工作文件窗口的最上方的信息栏中给出了观测数据的起止时期、截面成员个数以及观测值的总数。例如,上面例子所对应的信息栏如图7.5所示: 图7.4 工作文件结构对话框
图7.5
图7.5中的样本区间便是观测值的起始时期—1991-2003。
相应地,在非时期面板工作文件窗口最上方的信息栏中EViews 除给出数据和样本区间(1——观测值总数)外,还在数据区间信息后面给出截面成员数和截面成员所包含的最多观测值数。假设,工作文件中共有92个截面成员,截面成员中最多含有30个观测值,观测值的总数为506。那么该工作文件对应的信息栏如图7.6所示:值得注意的是,由于非时期面板没有数据对的概念,因此仍使用原有的观测值个数来作为样本区间的上限,即样本区间为:1-506。
图7.6
总之,在任何时候都可以通过双击工作文件窗口上方的“Range ”行或选择Poc/WF Structure&Range…打开工作文件结构对话框,对工作文件的结构结果进行适当的修改。
(2)观测值标签
打开普通工作文件中的序列后,在视图的左手边可以看到对应于每个观测值的标签列。在简单的未指定结构的工作文件中,这些标签便是一些简单的整数列(从1到工作文件中观测值的总数)。而在时期非面板工作文件中,这些标签便是与观测值相对应的日期序列。例如,在数据区间为1991-2003的年度工作文件中,观测值的标签列便是1991、1992、1993……。
而在面板工作文件中的观测值标识应该具有二维信息,即标签应该既反映观测值的截面信息又反映观测值的截面内信息即时期信息,因此,EViews 用截面ID 和单元ID 的联合形式作为每个观测值的标签。例如,在上面的例子中,我们用FCODE 作为截面ID ,用DA TEID 作单元ID ,则从图7.7中可以看出相应的观测值标签是由FCODE 和
DA TEID 序列信息联合构成的。一般来说
观测值标签的格式是与截面ID 和单元ID
的显示格式相对应的。在图7.7中FCODE
所表示的截面ID 部分含有两个字母,在
观测值标签中也含有相应的两个字母。但
是,值得注意的是,有时观测值标签中不
一定包含单元ID 的所有显示部分,例如,
当工作文件是年度面板结构的,由于已经
给定了工作文件的结构,因此EViews 便
会利用给定的结构信息在观测值标签中
用一个两位数来表示相应的年份,这样可
以缩短观测值标签的时期部分。从图7.7
给出的窗口可以看出观测值标签并没有
包含DA TEID 序列的全部信息,而是依照工作文件的时期结构用一个两位数来表示对应的时期。当然,我们也可以通过改变相应ID 序列(FCODE 和DA TEID 序列)的显示形式来改变观测值标签的显示格图7.7
式。打开相应的ID 序列窗口,单击属性(Properties )按钮之后,便可以根据需要在显示属性表单下对序列中显示的有效数字等显示属性进行修改。
3. Panel Data的方程估计
在面板工作文件中可以实现对各种变截距模型包括动态变截距模型的估计,其方程建立过程与普通工作文件中的方程建立过程相同,只是在方程说明窗口中增加了与Pool 对象中方程说明项类似的方程面板结构说明页,并且估计方法中增加了估计动态变截距模型的GMM 估计法。
下面以本章介绍的29个省市居民消费结构的固定影响变截距模型为例,具体介绍面板工作文件中变截距时间序列/截面数据模型的建立和估计。
以序列CS 为因变量,以序列YD 为解释变量建立方程,对方程面板结构说明页设置如图7.8所示: 采用GLS 法对模型进行估计,加权方式为Cross —section weights ,即允许模型存在截面异方差,单击
图7.8 面板结构说明页
“确定”后,EViews 给出了相应的估计结果。
估计结果输出的上半部分为:
在输出结果的最上面EViews 给出了因变量、估计方法以及样本的信息。接着在下面给出了解释变量对
应系数的估计结果。需要指出的是在该估计结果中,并没有直接给出固定影响的具体估计值。我们可以通过在方程对象下选择“View/Fixed/Random Effects/Cross-section Effects …”来查看相应的固定影响估计值。本例的固定影响估计结果如图7.9所示。
需要指出的是,此处EViews 给出的固定效应仍然是不含总体均值的个体影响,其反映的是各截面个体对总体平均状态的偏离。
虽然利用EViews 中的面板工作文件可以对堆积数据进行多种分析和处理,但是对堆积形式的序列的处理仍具有一定的局限性,目前还不能对堆积形式的序列进行季节调整也不能利用该形式的序列进行V AR 模型和VEC 模型的估计。