教学实习内容
第一部分 专题练习
要求:写出实验报告,具体内容: (1)实验结果 (2)结论
一、基本统计分析
1、已知土地调查资料tdtc.wkl(2000年土地调查的部分资料),其中变量qn 表示问卷编号,a1—a10对应调查问卷第一部分的问题1—10,b11—b20对应调查问卷第二部分的问题11—20。相应调查问卷的内容如下:
。
4。普通农民
1. 你家里有几口人?
2. 你家里有几个人分到了地?
1。增加
2。减少 1。村干部 2。中上等
3. 你估计在未来五年之内你家人口可能发生怎样的变化?
3。不变 4。说不清
2。党员 3。中等
3。村民代表 4。中下等
4. 你家耕地面积是多少亩? 5. 请问你是: 7。 8. 9.
11. 你这个村(或村民小组。下同)从分地到户到现在有没有进行过 土地调整(村里统一组织的调整)? 1。有
1。有 2。没有
3。不知道„„„„(若选 2 或 3,请接着看问题 19)
12。 请问共进行过几次土地调整? 13。 在这些土地调整中,几次是大调整? 14。 在这些土地调整中,几次是小调整?
6. 你认为你家的生活水平在本村属于:
1。上等
5。较差
请问你家庭年总收入大约多少元? 1。有
2。没有
你家有没有人搞副业(非农副业)或者在外面打工?
在你家的收入中来自非农业的部分大约是多少?或者说:非农业收入占你家总收入 1。绝大部分(90%以上) 3。约一半 (50%左右) 5。很少(10%以下)
1。几乎没有 (10%以下) 3。有一半 (50%左右)
2。有一小部分农户 (30%左右)
2.大部分(70%左右) 4。不到一半 (30%左右)
的比例有多大?
10。 请问你们村大概有多少农户有非农业收入?
4。大部分农户 (70%左右)
5。几乎所有农户 (90%以上) 6。不知道
15。你认为你村进行土地调整的最主要的原因是什么?(只选一个答案) 1。人口增减 2。因为村里的部分耕地被转为非农用地(被国家征用、村办企业占用等) 3。由于自然灾害使部分耕地毁坏 4。合并地块,便于耕作
16。土地是否调整由谁来决定?
1。村民(通过讨论、表决) 2。村干部 3。县、乡政府 4。中央政府
17。最近一次调整大概是哪年? 19
18。 最近一次调整是在贯彻土地承包30年不变政策时搞的吗 ? 1。是 2。不是
19。 你们村现在或者以前有没有实行过两田制 (责任田和口粮田)? 1。现在实行两田制 2。以前实行过两田制,但在贯彻30年不变政策(又称土地延包。下同。)之前 就已经废止了 3。以前实行过两田制,但在贯彻30年不变政策时废止了 4。从来没有实行过两田制 (若选此项,请接着看问题 27)
20。 两田制大概是从哪年开始的? 19
试进行以下统计:
(1) 统计土地有调整与没有调整的村(b11)的个数及所占有效样本的百分比。
提示:打开b11序列——View——One-Way Tabulation——按下列对话框的内容进行设置——按
ok
(2) 统计所有样本中土地调整次数(b12)的最小值、最大值、平均值。
提示:打开b12序列——View——DescriptiveStatistics&Tests——Stats Table
(3) 计算生成一新变量x1: 当a720000, x1=4
试统计家庭总收入各档次的样本的有效百分比。 提示:在Workfile窗口中——Object——Generate Series——按下列对话框的内容进行设置——按ok
再重复上述操作3次,每次操作时对上述对话框的内容按要求进行修改,即可形成所需要的变量x1。
最后在根据(1)的提示对x1进行相应的操作。 (4) 计算生成一新变量x2:
当a1>a2(分地人口小于家里人口)时,x2=1; 当a1=a2(分地人口等于家里人口)时,
x2=2; 当a1
(5)统计不同身份的人(a5)对问题16(b16)“土地是否调整由谁来决定”的回答情况。
提示:首先按下列操作修改样本区间:在Workfile窗口中——双击样本区间区域,按下列对话框的内容进行设置——按
ok
然后再根据(1)的提示对b16进行相应的操作。 重复上面步骤,并按要求修改对话框的内容。
注意:该题做完后请将样本区间恢复到全部。操作如下:
在Workfile窗口中——双击样本区间区域,按下列对话框的内容进行设置——按ok
(6)按家庭生活水平(a6)分组,进行如下统计: 1)家里耕地面积(a4)的最大、最小、平均值。
提示:打开a4序列——View——DescriptiveStatistics&Tests——Stats by Classification——按下列对话框的内容进行设置——按
ok
2)家庭总收入(a7)的最大、最小、平均值。
二、线性回归分析
1、设定模型Yi01X1i2X2i3X3ii,研究我国“税收收入Y”受“国内生产总值X1”、“财政支出X2”、“商品零售价格指数X3”的影响,据《中国统计年鉴》得到的样本数据如表1所示。
要求:
(1)建立工作文件 (2)输入数据
(3)估计模型参数、随机误差项的方差。
(4)检验模型,包括经济意义检验、拟合优度检验、变量显著性检验、方程显著性检验。(检验的显著性水平α=0.05,α=0.10分两种情况讨论)
(5)当2006年的X1=215000亿元,X2=35600亿元,X3=101.2%时,预测Y的值,并对预测结果进行评价。
2、某地1981-2005年国内生产总值Y、生产资金K、从业人数L的统计数据如表1所示。
(1)估计C—D生产函数
YA0(1r)tLKe
其中,各个参数的含义为:
A0——基期技术水平; r——技术进步率;
t——为时间变量;
——劳动的贡献份额; ——资本的贡献份额;
(2)进行统计推断检验
三、异方差性
1、建立住房支出模型:ytb0b1xtut,样本数据如表1下(其中:y是住房支出,x是收入,单位:千美元):
表1 住房支出与收入数据
(1)用最小二乘法估计b0,b1的估计值、标准差、拟合优度。
(2)用Goldfeld-Quandt检验异方差性(假设分组时不去掉任何样本值),取0.05。
(3)如果存在异方差性,假设t22xt2,用加权最小二乘法重新估计b0,b1的估计值、标准差、拟合优度。
2、为了给指定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数和人口数的回归模型。假定医疗机构数与人口数之间满足线性约束,则理论模型设定为:
yi01xii
其中Y表示卫生医疗机构数(个),X表示人口数(万人)。 地区 Y X 成都 6304.000 1013.300 自贡 911.0000 315.0000 攀枝花 934.0000 103.0000 泸州 1297.000 463.7000 德阳 1085.000 379.3000 绵阳 1616.000 518.4000 广元 1021.000 302.6000 遂宁 1375.000 371.0000 内江 1212.000 419.9000 乐山 1132.000 345.9000 南充 4064.000 709.2000 眉山 827.0000 339.9000 宜宾 1530.000 508.5000 广安 1589.000 438.6000 达州 2403.000 620.1000 雅安 866.0000 149.8000 巴中 1223.000 346.7000 资阳 1361.000 488.4000
阿坝 536.0000 82.90000 甘孜 594.0000 88.90000 凉山 1471.000 402.4000
要求:
(1) 利用e2(随机误差项方差)和X的散点图进行判断。 (2)利用White检验进行判断。
(3)用加权最小二乘法对一方差性进行修正。 (4)比较修正前后模型改进情况。
四、序列相关性 1、序列相关性
已知中国商品进口量M(亿美元)和国内生产总值GDP(亿元)如下:
年份 GDP M 1978 3624.100 108.9000 1979 4038.200 156.7000 1980 4517.800 200.2000 1981 4862.400 220.2000 1982 5294.700 192.9000 1983 5934.500 213.9000 1984 7171.000 274.1000 1985 8964.400 422.5000 1986 10202.20 429.1000 1987 11962.50 432.1000 1988 14928.30 552.7000 1989 16909.20 591.4000 1990 18547.90 533.5000 1991 21617.80 637.9000 1992 26638.10 805.9000 1993 34634.40 1039.600 1994 46759.40 1156.100 1995 58478.10 1320.800 1996 67884.60 1388.300 1997 74462.60 1423.700 1998 78345.20 1402.400 1999 82067.46 1657.000 2000 89442.20 2250.900 2001 95933.30 2436.100
要求:
1) 利用普通最小二乘法建立下列回归方程 Mt01GDPtt
2) 利用图示法进行自相关检验。 3) 用杜宾—瓦森法进行自相关检验。 4) 用拉格朗日乘数进行序列相关检验。
5) 用科克伦-奥科特法对序列相关性进行修正。 6)比较修正前后模型改进情况。
2、天津市城镇居民人均消费性支出(CONSUM),人均可支配收入(INCOME),以及消费价格指数(PRICE)见表4。定义人均实际消费性支出Y= CONSUM/ PRICE,人均实际可支配收入X= INCOME / PRICE。
表4 天津市城镇居民人均消费与人均可支配收入数据
(1)利用OLS估计模型:t01tt
(2)根据DW检验法、LM检验法检验模型是否存在自相关。
ˆ (3)如果存在一阶自相关,用DW值来估计自相关系数
ˆ=1-0.5DW 提示:
ˆ值,用OLS法估计广义差分方程: (4)利用估计的
ˆyt1b0(1ˆ)b1(xtˆxt1)vt yt
(5) 利用OLS估计模型:lnytb0b1lnxtut,检验此模型是否存在自相关,如何消除自相关?
五、多重共线性
1、某公司经理试图建立识别对管理有利的个人能力模型,他选取了15名新近提拨的职员,作一系列测试,决定他们的交易能力(x1)、与其他人联系的能力(x2)及决策能力(x3),每名职员的工作情况(y)依次对这三个变量作回归,原始数据如表3。
表3 样本数据
请回答以下问题:(1)建立回归模型:t011t22t33tt,并进行回归分析。(2)模型是否显著?(3)计算每个bi的方差膨胀因子VIFi,并判断是否存在多重共线性?
提示:方差膨胀银因子VIFi=1/(1-Ri),Ri表示第i个解释变量与模型中其他解释变量辅助回归模型的可决系数。一般地,当VIFi>5 或VIFi>10时,模型存在较严重的多重共线性。
2、已知各年度的粮食总产量Y,影响粮食生产的因素:农业化肥使用量X1,粮食播种面积X2、成灾面积X3、农业机械总动力X4、农业劳动力X5。建立粮食生产回归模型:
2
2
yi01x1i2x2i3x3i4x4i5x5ii
(1)用普通最小二乘法估计此模型
(2)根据(1)的结果,能否初步判断模型存在多重共线性?说明原因。 (3)求5个解释变量的简单相关系数矩阵,能得出什么结果? (4)根据逐步回归法,确定一个较好的粮食生产模型。
年份 Y X1 X2 X3 X4 X5 1983 38728.00 1659.800 114047.0 19209.30 18022.00 31645.10 1984 40731.00 1739.800 112884.0 15264.00 19497.00 31685.00 1985 37911.00 1775.800 108845.0 22705.30 20913.00 30351.50 1986 39151.00 1930.600 110933.0 23656.00 22950.00 30467.00 1987 40208.00 1999.300 111268.0 20392.70 24836.00 30870.00 1988 39408.00 2141.500 110123.0 23944.70 26575.00 31455.70 1989 40755.00 2357.100 112205.0 24448.70 28067.00 32440.50 1990 44624.00 2590.300 113466.0 17819.30 28708.00 33330.40 1991 43529.00 2806.100 112314.0 27814.00 29389.00 34186.30 1992 44264.00 2930.200 110560.0 25894.70 30308.00 34037.00 1993 45649.00 3151.900 110509.0 23133.00 31817.00 33258.20 1994 44510.00 3317.900 109544.0 31383.00 33802.00 32690.30 1995 46662.00 3593.700 110060.0 22267.00 36118.00 32334.50 1996 50454.00 3827.900 112548.0 21233.00 38547.00 32260.40 1997 49417.00 3980.700 112912.0 30309.00 42016.00 32434.90 1998 51230.00 4083.700 113787.0 25181.00 45208.00 32626.40 1999 50839.00 4124.300 113161.0 26731.00 48996.00 32911.80 2000 46218.00 4146.400 108463.0 34374.00 52574.00 32797.50
六、随机解释变量问题
1、某国的政府税收T(百万美元)、国内生产总值GDP(10亿美元)和汽车数量Z(百万辆)的观测数据如表3所示:
表3 某国政府税收、GDP和汽车数量数据
以汽车数量作为的工具变量,估计税收函数:t01tt
2、已知中国居民收入和消费支出表2所示。
t0
1t
(2)求残差e与GDP(-1) (滞后一期GDP)的相关系数,并判断GDP(-1)是否适合做工具变量。 (3) 试以GDP(-1)为工具变量,建立Y与GDP之间的回归模型。 (4)比较引入工具变量前后发生的变化。
七、虚拟变量
1、已知我国1982年第一季度到1988年第四季度的煤炭销售量。建立煤炭销售量Yt随时间变动模型
Yt=β0+β1t+μt
回答下列问题:
(1)画出煤炭销售量随时间变化的序列图,根据图形能得出什么结论?
(2)考虑季度因素对煤炭需求量的影响,应如何引入虚拟变量?试估计分析。
提示:
(1)画出序列图
建立工作文件,建立数据序列Y,并输入数据
打开序列Y,做序列图:View——Graph
(2
)设置如下三个季度虚拟变量。
1,第四季度
D1t=
0,其他 1,第三季度
D2t=
0,其他 1,第二季度
D3t=
0,其他
在模型中以加法方式引入虚拟变量以反映截距项的变动: YtDDDt0121t32t43tt
在Eviews中生成3个虚拟变量:Object——Generate Series
分别在对话窗口中输入:D1=@seas(4),D2=@seas(3),
D3=@seas(2) 计算回归模型参数:Quick——Estimate Equation 在出现对话窗口输入:Y C @TREND D1 D2 D3
(3)检验模型中时间t的斜率参数有无发生变异,应以乘法方式引入虚拟变量,由于D2、D3对Y的影响不显著,因而可建立如下模型:
YˆtDDtt0121t31tt
估计回归模型系数,在Estimate Equation窗口中输入: Y C @TREND D1 @TREND*D1
2、已知国民生产总值GDP和社会消费品零售总额SL从1995年第一季度到2003年第一季度的数据。 季度 国民生产总值 社会消费品零售总额
obs GDP SL 1995Q1 11858.50 4627.000 1995Q2 14109.10 4773.800 1995Q3 15535.00 5016.700 1995Q4 19291.10 6142.700 1996Q1 14261.20 5680.400 1996Q2 16600.60 5719.100 1996Q3 17671.30 5888.600 1996Q4 22643.50 7287.000 1997Q1 16256.70 6632.900 1997Q2 18697.60 6373.400 1997Q3 19148.10 6446.500 1997Q4 24870.60 7684.600 1998Q1 17501.30 7135.600 1998Q2 19721.40 6843.900 1998Q3 20372.50 7043.800 1998Q4 26807.10 8319.600 1999Q1 18789.70 7603.600 1999Q2 20765.20 7149.600 1999Q3 21859.30 7395.500 1999Q4 28262.90 8985.900 2000Q1 20647.00 8394.200 2000Q2 23101.20 7853.600 2000Q3 24339.30 8087.500 2000Q4 31127.10 9817.100 2001Q1 23299.50 9256.000 2001Q2 25651.40 8659.200 2001Q3 26867.30 8877.700 2001Q4 33837.00 10802.30 2002Q1 25375.70 10165.60 2002Q2 27965.30 9786.600 2002Q3 29715.70 10155.80 2002Q4 37276.00 11916.50 2003Q1 28861.80 11108.60 要求:
(1)画出国民生产总值GDP和社会消费品零售总额SL随时间变化的序列图,根据图形能得出什么结论?
(2)建立不含季度虚拟变量的回归方程:SLi01GDPii (3)建立考虑季度因素影响的回归方程。 (4)比较引入虚拟变量前后模型的变化。
八、滞后变量模型
1、已知某地区制造业部门1955-1974年期间的资本存量y和销售额x的统计资料如表8.2.1(单位:百万元)。
表8.2.1 某地区制造业部门资本存量和销售额资料
设定有限分布滞后模型为
ytab0xtb1xt1b2xt2b3xt3ut
运用经验加权法,选择下列三组权数:递减滞后、A型滞后、不变滞后
①1,
11
111211111,,;②,,,;③,,, [1**********]
分别估计上述模型,并从中选择最佳的方程。
2、表3给出了1970-1991年美国制造业固定厂房设备投资y与销售额x的相关数据(单位:亿元)。
表3 某地区1970-1991年固定资产投资与销售额资料
试就下列模型,按照一定的处理方法估计模型参数,并解释模型的经济意义,检验模型随机误差项的一阶自相关性。
(1)设定模型:yt*abxtut(其中yt*代表理想的或长期的新建厂房设备开支),运用局部调整假定。
(2)如果模型设定为yt*axtbet,请用局部调整模型进行估计,同(1)中的结果相比,你会选择哪个模型?
(3)设定模型:ytabxt*ut(其中xt*代表理想的销售量),运用自适应预期假定。与(1)中的结果相比,你认为哪个模型更适当一些?
(4)运用阿尔蒙多项式变换法,试用4期滞后和2次多项式估计分布滞后模型
u
ytab0xtb1xt1b2xt2b3xt3b4xt4ut
第二部分 综合练习
针对你感兴趣的经济问题,通过建立计量经济模型进行分析。 要求:写出一篇小论文,其内容包括: 题目 摘要 关键词 正文 引言
模型的选择与建立数据收集 结果分析
结论与政策建议 参考文献
提示:建立计量经济学模型的步骤: 1、理论模型的设计 2、样本数据的收集 3、模型参数的估计 4、模型的检验