计量经济学习题与答案
第一章绪论
1-14.计量经济模型中为何要包括随机误差项?简述随机误差项形成的原因。
答:由于客观经济现象的复杂性,以至于人们目前仍难以完全地透彻地了解它的全貌。对于某一种经济现象而言,往往受到很多因素的影响,而人们在认识这种经济现象的时候,只能从影响它的很多因素中选择一种或若干种来说明。这样就会有许多因素未被选上,这些未被选上的因素必然也会影响所研究的经济现象。因此,由被选因素构成的数学模型与由全部因素构成的数学模型去描述同一经济现象,必然会有出入。为使模型更加确切地说明客观经济现象,所以有必要引入随机误差项。随机误差项形成的原因:①在解释变量中被忽略的因素;②变量观测值的观测误差;③模型的关系误差或设定误差;④其他随机因素的影响。
第二章 一元线性回归模型
例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为
kids01educ
(1)随机扰动项包含什么样的因素?它们可能与教育水平相关吗?
(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。
解答:(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。
(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足。
例2.已知回归模型EN,式中E为某类公司一名新员工的起始薪金(元),N为所受教育水平(年)。随机扰动项的分布未知,其他所有假设都满足。
(1)从直观及经济角度解释和。
ˆ满足线性性、无偏性及有效性吗?简单陈述理由。 ˆ和(2)OLS估计量
(3)对参数的假设检验还能进行吗?简单陈述理由。 解答:
(1)N为接受过N年教育的员工的总体平均起始薪金。当N为零时,平均薪金为,因此表示没有接受过教育员工的平均起始薪金。是每单位N变化所引起的E的变化,即表示每多接受一年学
校教育所对应的薪金增加值。
ˆ满足线性性、无偏性及有效性,ˆ和仍(2)OLS估计量因为这些性质的的成立无需随机扰动项的
正态分布假设。
(3)如果t的分布未知,则所有的假设检验都是无效的。因为t检验与F检验是建立在的正态分布假设之上的。
例6.对于人均存款与人均收入之间的关系式StYtt使用美国36年的年度数据得如下估计模型,括号内为标准差:
ˆ384.1050.067YStt
(151.105)R2
(0.011)
ˆ19.092 3=0.538
(1)的经济解释是什么?
(2)和的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你可以给出可能的原因吗?
(3)对于拟合优度你有什么看法吗?
(4)检验是否每一个回归系数都与零显著不同(在1%水平下)。同时对零假设和备择假设、检验统计值、其分布和自由度以及拒绝零假设的标准进行陈述。你的结论是什么?
解答:(1)为收入的边际储蓄倾向,表示人均收入每增加1美元时人均储蓄的预期平均变化量。 (2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此符号应为负。储蓄是收入的一部分,且会随着收入的增加而增加,因此预期的符号为正。实际的回归式中,的符号为正,与预期的一致。但截距项为负,与预期不符。这可能与由于模型的错误设定形造成的。如家庭的人口数可能影响家庭的储蓄形为,省略该变量将对截距项的估计产生影响;另一种可能就是线性设定可能不正确。 (3)拟合优度刻画解释变量对被解释变量变化的解释能力。模型中53.8%的拟合优度,表明收入的变化可以解释储蓄中53.8 %的变动。
(4)检验单个参数采用t检验,零假设为参数为零,备择假设为参数不为零。双变量情形下在零假设下t 分布的自由度为n-2=36-2=34。由t分布表知,双侧1%下的临界值位于2.750与2.704之间。斜率项计算的t值为0.067/0.011=6.09,截距项计算的t值为384.105/151.105=2.54。可见斜率项计算的t 值大于临界值,截距项小于临界值,因此拒绝斜率项为零的假设,但不拒绝截距项为零的假设。
2-22.假设王先生估计消费函数(用模型CiabYiui表示),并获得下列结果:
Ci150.81Yi,n=19
(3.1) (18.7) R2=0.98 这里括号里的数字表示相应参数的T比率值。
要求:(1)利用T比率值检验假设:b=0(取显著水平为5%);(2)确定参数估计量的标准方差;(3)构
造b的95%的置信区间,这个区间包括0吗? 解: ⑴这是一个横截面序列回归。(图略)
⑵截距2.6911表示咖啡零售价在t时刻为每磅0美元时,美国平均消费量为每天每人2.6911杯,这个数字没有经济意义;斜率-0.4795表示咖啡零售价与消费量负相关,在t时刻,价格上升1美元/磅,则平均每天每人消费量减少0.4795杯; ⑶不能;
⑷不能;在同一条需求曲线上不同点的价格弹性不同,若要求出,须给出具体的X值及与之对应的Y值。
第三章、多元线性回归模型
例1.某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为
edu10.360.094sibs0.131medu0.210fedu
R2=0.214
式中,edu为劳动力受教育年数,sibs为该劳动力家庭中兄弟姐妹的个数,medu与fedu分别为母亲与父亲受到教育的年数。问
(1)sibs是否具有预期的影响?为什么?若medu与fedu保持不变,为了使预测的受教育水平减少一年,需要sibs增加多少?
(2)请对medu的系数给予适当的解释。
(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一个的父母受教育的年数为16年,则两人受教育的年数预期相差多少? 解答:
(1)预期sibs对劳动者受教育的年数有影响。因此在收入及支出预算约束一定的条件下,子女越多的家庭,每个孩子接受教育的时间会越短。
根据多元回归模型偏回归系数的含义,sibs前的参数估计值-0.094表明,在其他条件不变的情况下,每增加1个兄弟姐妹,受教育年数会减少0.094年,因此,要减少1年受教育的时间,兄弟姐妹需增加1/0.094=10.6个。
(2)medu的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时,母亲每增加1年受教育的机会,其子女作为劳动者就会预期增加0.131年的教育机会。
(3)首先计算两人受教育的年数分别为 10.36+0.13112+0.21012=14.452 10.36+0.13116+0.21016=15.816
因此,两人的受教育年限的差别为15.816-14.452=1.364
例2.以企业研发支出(R&D)占销售额的比重为被解释变量(Y),以企业销售额(X1)
与利润占销售额的比重(X2)为解释变量,一个有32容量的样本企业的估计结果如下:
Y0.4720.32log(X1)0.05X2
(1.37)
(0.22)
(0.046)
R20.099
其中括号中为系数估计值的标准差。
(1)解释log(X1)的系数。如果X1增加10%,估计Y会变化多少个百分点?这在经济上是一个很大
的影响吗?
(2)针对R&D强度随销售额的增加而提高这一备择假设,检验它不虽X1而变化的假设。分别在5%和10%的显著性水平上进行这个检验。
(3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响? 解答:
(1)log(x1)的系数表明在其他条件不变时,log(x1)变化1个单位,Y变化的单位数,即Y=0.32log(X1)0.32(X1/X1)=0.32100%,换言之,当企业销售X1增长100%时,企业研发支出占销售额的比重Y会增加0.32个百分点。由此,如果X1增加10%,Y会增加0.032个百分点。这在经济上不是一个较大的影响。
(2)针对备择假设H1:检验原假设H0:易知计算的t统计量的值为t=0.32/0.22=1.468。10,10。在5%的显著性水平下,自由度为32-3=29的t 分布的临界值为1.699(单侧),计算的t值小于该临界值,所以不拒绝原假设。意味着R&D强度不随销售额的增加而变化。在10%的显著性水平下,t分布的临界值为1.311,计算的t 值小于该值,拒绝原假设,意味着R&D强度随销售额的增加而增加。
(3)对X2,参数估计值的t统计值为0.05/0.46=1.087,它比在10%的显著性水平下的临界值还小,因此可以认为它对Y在统计上没有显著的影响。
例3.下表为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计值(括号内为p-值)(如果某项为空,则意味着模型中没有此变量)。数据为美国40个城市的数据。模型
如下:
housing01density2value3income4popchang
5unemp6localtax7statetax
式中housing——实际颁发的建筑许可证数量,density——每平方英里的人口密度,value——自由房屋的均值(单位:百美元),income——平均家庭的收入(单位:千美元),popchang——1980~1992年的人口增长百分比,unemp——失业率,localtax——人均交纳的地方税,statetax——人均缴纳的州税
(1)检验模型A中的每一个回归系数在10%水平下是否为零(括号中的值为双边备择p-值)。根据检验结
果,你认为应该把变量保留在模型中还是去掉? (2)在模型A中,在10%水平下检验联合假设H0:i =0(i=1,5,6,7)。说明被择假设,计算检验统计值,
说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明你的结论。 (3)哪个模型是“最优的”?解释你的选择标准。
(4)说明最优模型中有哪些系数的符号是“错误的”。说明你的预期符号并解释原因。确认其是否为正确
符号。 解答:
(1)直接给出了P-值,所以没有必要计算t-统计值以及查t分布表。根据题意,如果p-值
由于表中所有参数的p-值都超过了10%,所以没有系数是显著不为零的。但由此去掉所有解释变量,则会得到非常奇怪的结果。其实正如我们所知道的,多元回去归中在省略变量时一定要谨慎,要有所选择。本例中,value、income、popchang的p-值仅比0.1稍大一点,在略掉unemp、localtax、statetax的模型C中,这些变量的系数都是显著的。
(2)针对联合假设H0:i =0(i=1,5,6,7)的备择假设为H1:i =0(i=1,5,6,7) 中至少有一个不为零。检验假设H0,实际上就是参数的约束性检验,非约束模型为模型A,约束模型为模型D,检验统计值为
F
(RSSRRSSU)/(kUkR)(5.038e74.763e7)/(73)
0.462
RSSU/(nkU1)(4.763e7)/(408)
显然,在H0假设下,上述统计量满足F分布,在10%的显著性水平下,自由度为(4,32)的F分布的
临界值位于2.09和2.14之间。显然,计算的F值小于临界值,我们不能拒绝H0,所以βi(i=1,5,6,7)是联合不显著的。
(3)模型D中的3个解释变量全部通过显著性检验。尽管R2与残差平方和较大,但相对来说其AIC值最低,所以我们选择该模型为最优的模型。
(4)随着收入的增加,我们预期住房需要会随之增加。所以可以预期β3>0,事实上其估计值确是大于零的。同样地,随着人口的增加,住房需求也会随之增加,所以我们预期β4>0,事实其估计值也是如此。随着房屋价格的上升,我们预期对住房的需求人数减少,即我们预期β3估计值的符号为负,回归结果与直觉相符。出乎预料的是,地方税与州税为不显著的。由于税收的增加将使可支配收入降低,所以我们预期住房的需求将下降。虽然模型A是这种情况,但它们的影响却非常微弱。
3-17.假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整个学年收集数据,得到两个可能的解释
性方程:
ˆ125.015.0X11.0X21.5X3 0.75 方程A:Y
2
ˆ123.014.0X15.5X23.7X4 0.73 方程B:Y
2
其中:Y——某天慢跑者的人数
X1——该天降雨的英寸数 X2——该天日照的小时数
X3——该天的最高温度(按华氏温度) X4——第二天需交学期论文的班级数
请回答下列问题:(1)这两个方程你认为哪个更合理些,为什么?
(2)为什么用相同的数据去估计相同变量的系数得到不同的符号?
答:⑴方程B更合理些。原因是:方程B中的参数估计值的符号与现实更接近些,如与日照的小时数同向变化,天长则慢跑的人会多些;与第二天需交学期论文的班级数成反向变化,这一点在学校的跑道模型中是一个合理的解释变量。
⑵解释变量的系数表明该变量的单位变化在方程中其他解释变量不变的条件下对被解释变量的影响,在方程A和方程B中由于选择了不同的解释变量,如方程A选择的是“该天的最高温度”而方程B选择的是“第二天需交学期论文的班级数”,由此造成X2与这两个变量之间的关系不同,所以用相同的数据估计相同的变量得到不同的符号。
3-19.假定以校园内食堂每天卖出的盒饭数量作为被解释变量,盒饭价格、气温、附近餐厅的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行回归分析;假设不管是否有假期,
食堂都营业。不幸的是,食堂内的计算机被一次病毒侵犯,所有的存储丢失,无法恢复,你不能说出独立变量分别代表着哪一项!下面是回归结果(括号内为标准差):
ˆi10.628.4X1i12.7X2i0.61X3i5.9X4i Y
(2.6) (6.3) (0.61) (5.9) R0.63 n35
要求:
(1)试判定每项结果对应着哪一个变量? (2)对你的判定结论做出说明。
答:⑴答案并不唯一,猜测为:X1为学生数量,X2为附近餐厅的盒饭价格,X3为气温,X4为校园内食堂的盒饭价格;
⑵理由是被解释变量应与学生数量成正比,并且应该影响显著;与本食堂盒饭价格成反比,这与需求理论相吻合;与附近餐厅的盒饭价格成正比,因为彼此是替代品;与气温的变化关系不是十分显著,因为大多数学生不会因为气温升高不吃饭。
2
3-28.考虑以下预测的回归方程:
2ˆYt1200.10Ft5.33RSt R0.50
其中:Yt——第t年的玉米产量(蒲式耳/亩)
Ft——第t年的施肥强度(磅/亩) RSt——第t年的降雨量(英寸)
要求回答下列问题:
(1)从F和RS对Y的影响方面,说出本方程中系数0.10和5.33的含义; (2)常数项120是否意味着玉米的负产量可能存在? (3)假定F的真实值为0.40,则估计值是否有偏?为什么?
(4)假定该方程并不满足所有的古典模型假设,即并不是最佳线性无偏估计值,则是否意味着RS的真实
值绝对不等于5.33?为什么?
解:⑴在降雨量不变时,每亩增加一磅肥料将使第t年的玉米产量增加0.1蒲式耳/亩;在每亩施肥量不变的情况下,每增加一英寸的降雨量将使第t年的玉米产量增加5.33蒲式耳/亩;
⑵在种地的一年中不施肥、也不下雨的现象同时发生的可能性极小,所以玉米的负产量不可能存在; ⑶如果F的真实值为0.40,并不能说明0.1是有偏的估计,理由是0.1是本题估计的参数,而0.40是从总体得到的系数的均值。
⑷不一定。即便该方程并不满足所有的古典模型假设、不是最佳线性无偏估计值,也有可能得出的估计系数等于5.33。
第四章 经典单方程计量经济学模型:放宽基本假定的模型
1、下列哪种情况是异方差性造成的结果?
(1)OLS估计量是有偏的
(2)通常的t检验不再服从t分布。
(3)OLS估计量不再具有最佳线性无偏性。 解答:
第(2)与(3)种情况可能由于异方差性造成。异方差性并不会引起OLS估计量出现偏误。
3、已知模型 Yi01X1i2X2iui
式中,Yi为某公司在第i个地区的销售额;X1i为该地区的总收入;X2i为该公司在该地区投入的广告费用(i=0,1,2„„,50)。
(1)由于不同地区人口规模Pi可能影响着该公司在该地区的销售,因此有理由怀疑随机误差项ui是异方差的。假设i依赖于总体Pi的容量,请逐步描述你如何对此进行检验。需说明:1)零假设和备择假设;2)要进行的回归;3)要计算的检验统计值及它的分布(包括自由度);4)接受或拒绝零假设的标准。 (2)假设iPi。逐步描述如何求得BLUE并给出理论依据。 解答:
(1)如果i依赖于总体Pi的容量,则随机扰动项的方差i2依赖于Pi2。因此,要进行的回归的一种
2形式为i201Pii。于是,要检验的零假设H0:10,备择假设H1:10。检验步骤如
下:
~2; 第一步:使用OLS方法估计模型,并保存残差平方项ei~2对常数项C和P2的回归 第二步:做eii
第三步:考察估计的参数1的t统计量,它在零假设下服从自由度为2的t分布。
第四步:给定显著性水平面0.05(或其他),查相应的自由度为2的t分布的临界值,如果估计的参数
ˆ1的t统计值大于该临界值,则拒绝同方差的零假设。
(2)假设iPi时,模型除以Pi有:
YiXXu1
011i22ii PiPiPiPiPi
由于Var(ui/Pi)i2/Pi22,所以在该变换模型中可以使用OLS方法,得出BLUE估计值。方法是对Yi/Pi关于1/Pi、X1i/Pi、X2i/Pi做回归,不包括常数项。
4、以某地区22年的年度数据估计了如下工业就业回归方程
Y3.890.51lnX10.25lnX20.62lnX3
(-0.56)(2.3) (-1.7) (5.8)
R0.996 DW1.147
式中,Y为总就业量;X1为总收入;X2为平均月工资率;X3为地方政府的总支出。
(1)试证明:一阶自相关的DW检验是无定论的。 (2)逐步描述如何使用LM检验 解答:
(1)由于样本容量n=22,解释变量个数为k=3,在5%在显著性水平下,相应的上下临界值为dU1.664、
2
dL1.503。由于DW=1.147位于这两个值之间,所以DW检验是无定论的。
(2)进行LM检验:
~; 第一步,做Y关于常数项、lnX1、lnX2和lnX3的回归并保存残差et~的回归并计算R; ~关于常数项、lnX1、lnX2和lnX3和e第二步,做et1t
2
第三步,计算检验统计值(n-1)R=210.996=20.916;
第四步,由于在不存在一阶序列相关的零假设下(n-1)R呈自由度为1的分布。在5%的显著性水平下,该分布的相应临界值为3.841。由于20.916>3.841,因此拒绝零假设,意味着原模型随机扰动项存在一阶序列相关。
5、某地区供水部门利用最近15年的用水年度数据得出如下估计模型:
2
2
2
water326.90.305house0.363pop0.005pcy17.87price1.123rai n
(-1.7) (0.9) (1.4) (-0.6) (-1.2) (-0.8)
20.93
F=38.9
式中,water——用水总量(百万立方米),house——住户总数(千户),pop——总人口(千人),pcy—
—人均收入(元),price——价格(元/100立方米),rain——降雨量(毫米)。
(1)根据经济理论和直觉,请计回归系数的符号是什么(不包括常量),为什么?观察符号与你的直觉相符吗?
(2)在10%的显著性水平下,请进行变量的t-检验与方程的F-检验。T检验与F检验结果有相矛盾的现象吗?
(3)你认为估计值是(1)有偏的;(2)无效的或(3)不一致的吗?详细阐述理由。 解答:
(1)在其他变量不变的情况下,一城市的人口越多或房屋数量越多,则对用水的需求越高。所以可期望house和pop的符号为正;收入较高的个人可能用水较多,因此pcy的预期符号为正,但它可能是不显著的。如果水价上涨,则用户会节约用水,所以可预期price的系数为负。显然如果降雨量较大,则草地和其他花园或耕地的用水需求就会下降,所以可以期望rain的系数符号为负。从估计的模型看,除了pcy之外,所有符号都与预期相符。
(2)t-统计量检验单个变量的显著性,F-统计值检验变量是否是联合显著的。
这里t-检验的自由度为15-5-1=9,在10%的显著性水平下的临界值为1.833。可见,所有参数估计值的t值的绝对值都小于该值,所以即使在10%的水平下这些变量也不是显著的。
这里,F-统计值的分子自由度为5,分母自由度为9。10%显著性水平下F分布的临界值为2.61。可见计算的F值大于该临界值,表明回归系数是联合显著的。
T检验与F检验结果的矛盾可能是由于多重共线性造成的。house、pop、pcy都是高度相关的,这将使它们的t-值降低且表现为不显著。price和rain不显著另有原因。根据经验,如果一个变量的值在样本期间没有很大的变化,则它对被解释变量的影响就不能够很好地被度量。可以预期水价与年降雨量在各年中一般没有太大的变化,所以它们的影响很难度量。
(3)多重共线性往往表现的是解释变量间的样本观察现象,在不存在完全共线性的情况下,近似共线并不意味着基本假定的任何改变,所以OLS估计量的无偏性、一致性和有效性仍然成立,即仍是BLUE估计量。但共线性往往导致参数估计值的方差大于不存在多重共线性的情况。
6、一个对某地区大学生就业增长影响的简单模型可描述如下
gEMPt01gMIN1t2gPOP3gGDP1t4gGDPtt
式中,为新就业的大学生人数,MIN1为该地区最低限度工资,POP为新毕业的大学生人数,GDP1为该地区国内生产总值,GDP为该国国内生产总值;g表示年增长率。
(1)如果该地区政府以多多少少不易观测的却对新毕业大学生就业有影响的因素作为基础来选择最低限度工资,则OLS估计将会存在什么问题?
(2)令MIN为该国的最低限度工资,它与随机扰动项相关吗?
(3)按照法律,各地区最低限度工资不得低于国家最低工资,哪么gMIN能成为gMIN1的工具变量吗? 解答:
(1)由于地方政府往往是根据过去的经验、当前的经济状况以及期望的经济发展前景来定制地区最低限度工资水平的,而这些因素没有反映在上述模型中,而是被归结到了模型的随机扰动项中,因此 gMIN1 与不仅异期相关,而且往往是同期相关的,这将引起OLS估计量的偏误,甚至当样本容量增大时也不具有一致性。
(2)全国最低限度的制定主要根据全国国整体的情况而定,因此gMIN基本与上述模型的随机扰动项无关。
(3)由于地方政府在制定本地区最低工资水平时往往考虑全国的最低工资水平的要求,因此gMIN1与gMIN具有较强的相关性。结合(2)知gMIN可以作为gMIN1的工具变量使用。
4-6.在如下回归中,你是否预期存在着异方差?
4-6.答:存在;不存在;不存在;存在;存在。
第五章 经典单方程计量经济学模型:专门问题
例1.一个由容量为209的样本估计的解释CEO薪水的方程为
Ln(salary)=4.59 +0.257ln(sales)+0.011roe+0.158finance +0.181consprod – 0.283utility
(15.3) (8.03) (2.75) (1.775) (2.130) (-2.895)
其中,salary 表示年薪水(万元)、sales表示年收入(万元)、roe表示公司股票收益(万元);finance、consprod和 utility均为虚拟变量,分别表示金融业、消费品工业和公用事业。假设对比产业为交通运输业。
(1)解释三个虚拟变量参数的经济含义;
(2)保持sales和roe不变,计算公用事业和交通运输业之间估计薪水的近似百分比差异。这个差异在1%的显著水平上是统计显著的吗?
(3)消费品工业和金融业之间估计薪水的近似百分比差异是多少?写出一个使你能直接检验这个差异是否统计显著的方程。
解答:
(1)finance的参数的经济含义为:当销售收入与公司股票收益保持不变时,金融业的CEO要比交通运输业的CEO多获薪水15.8个百分点。其他两个可类似解释。
(2)公用事业和交通运输业之间估计薪水的近似百分比差异就是以百分数解释的utility的参数,即为28.3%。由于参数的t统计值为-2.895,它大于1%显著性水平下自由度为203的t分布的临界值1.96,因此这种差异是统计上显著的。
(3)由于消费品工业和金融业相对于交通运输业的薪水百分比差异分别为15.8%与18.1%,因此它们间的差异为18.1% - 15.8% = 2.3%。一个能直接检验这一差异是否显著的方程为
ln(salary)01ln(salse)2roe1consprod2utilty3transu
其中,trans为交通运输业虚拟变量。这里对比基准为金融业,因此1表示了消费品工业与金融业薪水的百分数差异,其t 统计值可用来进行显著性检验。
例2.假设货币需求关系式为MtYtRt,式中,Mt为时间t的实际现金余额;Yt
为时间t的“期望”实际收入;Rt为时间t的利率。根据适应规则,YtYt1(1)Y
t1t,01
修改期望值。已知Yt,Mt,Rt的数据,但Yt的数据未知。
(1)建立一个可以用于推导,,和估计值的经济计量模型。
(2)假设E(t)0,E(t2)2,E(tts)0,s0;Yt1,Rt,Mt1和Rt1与t都不相关。OLS估计值是1)无偏的;2)一致的吗?为什么?
(3)假设t=t1t,
的吗?为什么?
解答:
(1)由于 t的性质类似(2)部分。那么,本例中OLS估计值是1)无偏的;2)一致
MtYtRt (1)
YtYt1(1)Y
t1t (2)
第二个方程乘以有
由第一个方程得 YtYt1(1)Yt1t (3)
Yt*MtRt
Yt*1Mt1Rt1
代入方程(3)得
MtRtYt1(1)(Mt1Rt1)t
整理得
Mt(1)Yt1Rt(1)Mt1(1)Rt1t
=Yt1(1)Mt1Rt(1)Rt1t
该模型可用来估计并计算出,,和。
(2)在给定的假设条件下,尽管t与Mt相关,但t与模型中出现的任何解释变量都不相关,因此只是与M存在异期相关,所以OLS估计是一致的,但却是有偏的估计值。
(3)如果tt1t,则Mt1和t相关,因为Mt1与t1相关。所以OLS估计结果有偏且不一致。
3、一个估计某行业ECO薪水的回归模型如下
ln(salary)01ln(sales)2ln(mktval)3profmarg
4ceoten5comten
其中,salary 为年薪sales为公司的销售收入,mktval为公司的市值,profmarg为利润占销售额的百分比,
ceoten为其就任当前公司CEO的年数,comten为其在该公司的年数。一个有177个样本数据集的估计得到R2=0.353。若添加ceoten2和comten2后,R2=0.375。问:此模型中是否有函数设定的偏误? 解答:
若添加ceoten2和comten2后,估计的模型为
ln(salary)01ln(sales)2ln(mktval)3profmarg
4ceoten5comten6ceoten7comten22
如果6、7是统计上显著不为零的,则有理由认为模型设定是有偏误的。而这一点可以通过第三章介绍的受约束F检验来完成:
F(0.3750.353)/22.97 (10.375)/(1778)
在10%的显著性水平下,自由度为(2,)的F分布的临界值为2.30;在5%的显著性水平下,临界值为3.0。由此可知在10%的显著性水平下拒绝6=7=0的假设,表明原模型有设定偏误问题;而在5%的显著性水平下则不拒绝6=7=0的假设,表明原模型没有设定偏误问题。
5-2.在建立计量经济模型时,什么时候、为什么要引入虚拟变量?
答:在现实经济生活中,除了诸如:利润、成本、收入、价格等具有数量特征、影响某个经济问题的变量外,还有一类变量,如:季节、民族、自然灾害、战争、政府制定的某项经济政策等也会影响某些经济问题且可能是重要的影响因素,如:讨论改革前后的经济发展的对比,讨论像空调、冷饮等季节性产品的销售,讨论女性化妆品的销售等问题时,不可避免的要考虑后一类变量。这后一类变量所反映的并不是数量而是某种性质或属性,我们前面所讨论的回归模型是一种定量模型,所以在引入这类反映性质或属性的变量时需要先将其定量化。在计量经济学中,我们把这些反映性质或属性的变量叫“虚拟变量”。规定具备某种属性时把虚拟变量赋值为“1”,反之为“0”。
5-3.举例说明虚拟变量在模型中的作用。
答:以调查某地区居民性别与收入之间的关系为例(设解释变量中只含有虚拟变量),我们可以用模型表示:
yiDiui
1(男)Dy其中代表收入,Di为虚拟变量,i 0(女)
可以看出, 代表女性的收入,代表男性与女性收入之间的差额,从yiDiui式很容易得出:
,Di0(女) E(yi)Di,D1(男)i
检验假设0,就是检验男女的平均收入之间是否有差额。若:H0:0成立,说明收入与性别没有明显关系。若H0:0不成立,说明收入与性别有明关系。
5-4.什么是“虚拟变量陷阱”?
答:以季节性产品冷饮的销量为例说明。假设销售函数模型为:
yt01x1tkxktui
其中yt表示销量,x1t,x2t,xkt表示决定销量的解释变量;已知除定量解释变量的影响外,还受春、夏、秋、冬四季的影响,为把季节变化对销量的影响反映到模型中,如果我们引入4个虚拟变量:
2、3、41,第i季:i1、Di 0,其它季节
这样销售函数的季节回归模型为:
yt01x1tkxkt1D1t2D2t3D3t4D4tui
4个虚拟变量之间具有关系:D1tD2tD3tD4t1,出现完全多重共线性问题,使OLS法不能使用,这就称为“虚拟变量陷阱”。为克服这一问题,一般在引入虚拟变量时要求如果有m个定性变量,只在模型中引入m-1个虚拟变量。
5-5.对包含常数项的季节变量模型运用最小二乘法时,如果模型中引入4个季节虚拟变量,其估计结果会出现什么问题?
答:对包含常数项的季节变量模型运用OLS法时,如果模型中引入4个季节虚拟变量,会造成完全多重共线性,则参数估计量不存在;其次,即便是一般共线性,使用OLS法参数估计量非有效;参数估计量经济含义不合理;变量的显著性检验失去意义;模型的预测功能失效。
5-9.试在消费函数YX中(以加法形式)引入虚拟变量,用以反映季节因素(淡、旺季)和收入层次差异(高、中、低)对消费需求的影响,并写出各类消费函数的具体形式。
答:在消费函数YX中以加法形式引入虚拟变量,用以反映季节因素(淡、旺)和收入层次差异(高、中、低)对消费需求的影响,形如下式:
1(旺季), Yi1X2Di3Djui 其中:Di0(淡季)
5-19.如果一个定性变量含有k个类别,为什么不能设k个虚拟变量?
答:如果一个定性变量含有k个类别,一般只能设k1个虚拟变量,以避免多重共线。