身高和体重的函数分析
题 目:学 院:班 级:姓 名:学 号:指导老师:
体重与身高之间的函数关系分析 经济学院 经济三班 刘金典 [1**********] 乔雅君
第1页
体重与身高之间的函数关系分析
刘金典
(河南财经政法大学 经济学院 河南 郑州 450000)
摘要:本文通过对经济学院167名同学的身高和体重数据,建立计量经济模型,运用Eiews5.0软件对经济三班和经济学院全体学生的身高体重数据进行模型估计。通过检验,对模型进行合适的修正,进而得出更科学合理的模型。并且也考虑到性别对函数关系的影响,通过对估计结果的分析,估计方法的选择和修正的过程可以得出选用虚拟变量的作用。 关键词:身高、体重
一、实验目的
为了分析体重与身高的关系以及性别对体重的影响,应用经济学院四个班同学的身高与体重的数据进行模型估计。已找到身高对体重的影响。并且通过性别虚拟变量的引入,考察虚拟变量在模型估计中的作用。从对经济三班的数据分析到对整个经济学院四个班的数据全体的分析中可以发现数据容量对于模型估计精度的影响。通过对模型的一系列的修正可以更清晰地发现修正模型的方法。
二、数据说明
下面是09级经济三班以及09级经济四个班的详细真实数据
表1:09级经济三班41名同学的详细数据
第2页
图1:三班体重与身高数据关系图
上图是由三班的身高体重的数据通过Excel 中的绘图功能做出来的。从上图中我们可以看出三班同学的身高和体重有比较弱的正相关性。也即是身高和体重的关系是:身高越高,那么体重在某种程度上会更重;反之,身高越低那么体重就会越轻。途中身高和体重的关系拟合出的直线上下的数据说明了身高和体重的波动。
表2:09级经济学院167名同学详细数据
第3页
第4页
图2:四个班班体重与身高数据关系图
由图二可以看出经济学院四个班的学生的身高体重也有较为微弱的线性关系。同样拟合的那条趋势线的上面下面浮动的数据反映了身高体重的波动。似乎样本容量的增大没有得到更好的拟合。
三、实证分析
(一)三班数据简单回归
1. 建立模型
为了研究河南财经政法大学经济学院同学们体重与身高的关系关系,建立模型如下:W =α0+α1H +u ,其中W 表示某位同学的体重,H 则表示某位同学的身高,α0表示截距项,α1表示体重受身高的影响的斜率系数,但这二者都是未知数。u 表示随机误差项。 2. 估计结果
第5页
通过Eviews5.0运行估计结果如下:
表 3:三班身高与体重函数关系E-views5.0估计结果:
Dependent Variable: W Method: Least Squares Date: 01/27/09 Time: 11:23 Sample: 1 41
Included observations: 41 Variable H C R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
Coefficient Std. Error 0.982918 0.117705 -105.5248 19.84982
t-Statistic 8.350708 -5.316160
Prob. 0.0000 0.0000 60.06098 9.606115 6.410199 6.493788 69.73432 0.000000
0.641328 Mean dependent var 0.632131 S.D. dependent var 5.826321 Akaike info criterion 1323.895 Schwarz criterion -129.4091 F-statistic 1.277523 Prob(F-statistic)
上面的Equation 结果可表示为:
ˆ=0. 9829W H -105. 5248 (0. 1177) (19.8498)t 值 8.3507 -5.3162p 值 0.0000 0.0000
2
2
R =0. 6413,R =0. 6321,F =69. 7343(p =0. 0000)
3. 模型检验
显著性检验——t 检验
由图1可知,对常数项α0进行t 检验的P 值=0.0000,对α1进行t 检验的P 值=0.0000,在显著性水平是0.05的情况下,由于二者的P 值均小于0.05,所以拒绝原假设。即α0=0、α1=0均被显著拒绝,可以认为在体重身高模型中,截矩项显著不为0,斜率系数也显著不为0则身高对体重显著性影响。
第6页
(二)三班数据加入性别虚拟变量回归
1. 以加法方式引入性别虚拟变量 (1)建立模型
W =α0+α1H +α2S +u ,其中W 表示某位同学的体重,H 则表示某位同学的
身高,S 是代表性别的虚拟变量,其中S=0表示女生,S=1表示男生,α0表示截距项,α1表示体重受身高的影响的斜率系数,α2表示体重受性别的影响系数,且α0、α1、α2都是未知数。u 表示随机误差项。 (2)估计结果
通过Eviews5.0运行估计结果如下:
表 4: 三班身高与体重引入性别后的函数关系E-views5.0估计结果:
Dependent Variable: W Method: Least Squares Date: 01/27/09 Time: 11:56 Sample: 1 41
Included observations: 41 Variable S H C R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
Coefficient Std. Error 4.671153 0.735592
3.122302 0.201887
t-Statistic 1.496061 3.643593 -2.017191
Prob. 0.1429 0.0008 0.0508 60.06098 9.606115 6.401749 6.527133 37.09324 0.000000
-66.13804 32.78720 0.661278 0.643451 5.735978 1250.255
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion
-128.2359 F-statistic 1.357394
Prob(F-statistic)
上面的Equation 结果可表示为:
第7页
ˆ=0. 7356W H +4. 6712S -66. 1380 (0. 2019) (3.1223)(32. 7872)t 值 3.6436 1.4961 -2.0172p 值 0.0008 0.1429 0.0508
R =0. 6612,R =0. 0. 6434,F =37. 0932(p =0. 0000)
(3)模型检验 显著性检验——t 检验
由图2可知,对常数项α0进行t 检验的P 值=0.0508,对α1进行t 检验的P 值=0.0008,α2进行t 检验的P 值=0.1429.在显著性水平是0.05的情况下,由于α1的P 值小于0.05,所以拒绝原假设。但α0、α2的P 值大于0.05即α0=0、
2
2
α2=0均被显著接受,即:在加法模型中,身高对体重仍有显著性影响,但截距
项和性别对体重的影响并不显著。 2. 以乘法方式引入性别虚拟变量 (1)建立乘法模型
W =α0+α1H +α2SH +u 其中,W 表示某位同学的体重,H 则表示某位
同学的身高,S 是代表性别的虚拟变量,其中S=0表示女生,S=1表示男生,α0表示截距项,α1表示体重受身高的影响的斜率系数,α2表示体重受性别的影响系数,且α0、α1、α2都是未知数。u 表示随机误差项,表示不可由模型中的解释变量解释。 (2)估计结果
通过Eviews5.0估计结果如下:
表5:三班身高与体重引入性别后的函数关系E-views5.0估计结果:
Dependent Variable: W Method: Least Squares Date: 01/27/09 Time: 12:15 Sample: 1 41
Included observations: 41 第8页
Variable SH H C R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
Coefficient Std. Error 0.028242 0.715744
0.018621 0.210809
t-Statistic 1.516635 3.395220 -1.839480
Prob. 0.1376 0.0016 0.0737 60.06098 9.606115 6.400210 6.525593 37.17965 0.000000
-62.92593 34.20855 0.661799 0.643999 5.731565 1248.332
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion
-128.2043 F-statistic 1.353948
Prob(F-statistic)
上面的Equation 结果可表示为:
ˆ=-62. 9259+0. 7154H +0. 0282SH W
(34. 2086) (0. 2108) (0. 1862)
t 值 -1. 8395 3.3952 1.5166P 值 0.0737 0.0016 0.1376
R 2=0. 6618,2=0. 6440,F =37. 1797(P =0. 0000)
0. 7154H -62. 9259 S =0女ˆ=⎧即W ⎨
S =1男⎩0. 7436H -62. 9259(3)模型检验 显著性检验——t 检验
对常数项α0进行t 检验的P 值=0.0737,对α1进行t 检验的P 值=0.0016,α2
进行t 检验的P 值=0.1376。在显著性水平是0.05的情况下,由于α1的P 值均小于0.05,所以拒绝原假设。但α0、α2的P 值大于0.05即α0=0、α2=0均被显著接受,即在乘法模型中,身高对体重仍有显著性影响,但截距项和性别对体重的影响并不显著。
(三)四个班数据简单回归
1. 建立模型
为了分析体重与身高之间的关系,建立模型如下:
W 0=β0+β1H 0+u
,其中W 0表示某位同学的体重,H 0则表示某位同
第9页
学的身高,β0表示截距项,β1表示体重受身高的影响系数,但这二者都是未知数。u 表示随机误差项。 2. 估计结果
通过Eviews6.0估计结果如下:
表6:四个班班身高与体重函数关系E-views5.0估计结果:
Dependent Variable: W0 Method: Least Squares Date: 05/12/12 Time: 13:00 Sample: 1 167
Included observations: 167 Variable H 0 C R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 1.088517 -124.1379 0.606730 0.604346 6.227018 6398.000 -541.3826 254.5588 0.000000
Std. Error 0.068225 11.46084
t-Statistic 15.95490 -10.83149
Prob. 0.0000 0.0000 58.55689 9.899711 6.507576 6.544917 6.522732 1.936702
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
上面的Equation 结果可表示为:
ˆ=1. 0885W H 0-124. 13790 (00. 0682) (11.4608)t 值 15.9549 -10.8315p 值 0.0000 0.0000
R =0. 6067,R =0. 6043,F =254. 5588(p =0. 0000)
3. 模型检验
显著性检验——t 检验。对常数项β0进行t 检验的P 值=0.0000,对β1进行t 检验的P 值=0.0000,在显著性水平是0.05的情况下,由于二者的P 值均小于
第10页
2
2
0.05,所以拒绝原假设。即β0=0、β1=0均被显著拒绝,可以认为在体重身高模型中,截矩项显著不为0,斜率系数显著不为0,则身高对体重显著性影响。
(四)四个班数据加入性别虚拟变量
1. 以加法方式引入性别虚拟变量 (1)建立模型
W 0=β0+β1H 0+β2S +u ,其中,W 0表示某位同学的体重,H 0则表示某位同学
的身高,S 是代表性别的虚拟变量,其中S=0表示女生,S=1表示男生,β0表示截距项,β1表示体重受身高的影响的斜率系数,β2表示体重受性别的影响系数,且β0、β1、β2都是未知数。u 表示随机误差项。 (2)估计结果
通过Eviews6.0估计结果如下:
表7:四个班身高与体重引入性别后的E-views5.0估计结果:
Dependent Variable: W0 Method: Least Squares Date: 05/12/12 Time: 13:13 Sample: 1 167
Included observations: 167 Variable S H 0 C R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 4.407906 0.840822 -84.54488 0.624658 0.620081 6.101942 6106.325 -537.4865 136.4676 0.000000
Std. Error 1.574893 0.110912 18.06213
t-Statistic 2.798861 7.580987 -4.680782
Prob. 0.0057 0.0000 0.0000 58.55689 9.899711 6.472892 6.528904 6.495626 2.041602
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
上面的Equation 结果可表示为:
第11页
ˆ=0. 8408W H 0+4. 4079S -84. 54490 (0. 1109) (1.5749) (18. 0621)t 值 7.5810 2.7989 -4.6808p 值 0.0000 0.0057 0.0000
R =0. 6247,R =0. 6201,F =136. 4676(p =0. 0000)
(3)模型检验
显著性检验——t 检验。由图5可知,对常数项β0进行t 检验的P 值=0.00000,对β1进行t 检验的P 值=0.0000,β2进行t 检验的P 值=0.0057.在显著性水平是0.05的情况下,由于β0、β1、β2的P 值均小于0.05,所以拒绝原假设。即:身高和性别对体重的影响都是比较显著的。最终的估计结果为:
2
2
0.. 8408H 0-84.5449 S =0女ˆ=⎧ W ⎨0
H 0-80.1370 S =1男⎩0. 84082. 以乘法方式引入性别虚拟变量 (1)建立模型
其中W 0表示某位同学的体重,H 0则表示某位同学的W 0=β0+β1H 0+β2SH 0+u ,
身高,S 是代表性别的虚拟变量,其中S=0表示女生,S=1表示男生,β0表示截距项,β1表示体重受身高的影响的斜率系数,β2表示体重受性别的影响系数,且β0、β1、β2都是未知数。u 表示随机误差项。 (2)估计结果
通过Eviews6.0估计结果如下:
表8:四个班班身高与体重引入性别后的E-views5.0估计结果:
Dependent Variable: W0 Method: Least Squares Date: 05/12/12 Time: 13:30 Sample: 1 167
Included observations: 167 Variable SH 0 H 0
Coefficient 0.027168 0.816735
Std. Error 0.009399 0.115312 第12页
t-Statistic 2.890501 7.082840
Prob. 0.0044 0.0000
C R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
-80.64652 0.625794 0.621230 6.092705 6087.854 -537.2335 137.1305 0.000000
18.76533 -4.297635 0.0000 58.55689 9.899711 6.469862 6.525874 6.492596 2.042434
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
上面的Equation 结果可表示为:
ˆ=-80. 6456+0. 8167H +0. 0272SH W 000
(18. 7653) (0. 1153) (0. 0094)t 值 -4. 2976 7.0828 2.8905P 值 0.0000 0.0000 0.0044
R 2=0. 6258,2=0. 6212,F =137. 1305(P =0. 0000)
(3)模型检验
显著性检验——t 检验,由图6可知,对常数项β0进行t 检验的P
值=0.0000,对β1进行t 检验的P 值=0.0000,β2进行t 检验的P 值=0.0044。在显著性水平是0.05的情况下,由于β0、β1、β2的P 值均小于0.05,所以拒绝原假设。身高和性别对体重都有显著性影响。最终的估计结果为:
0.. 8167H 0-80.6456 S =0女ˆ=⎧ W ⎨0
S =1男⎩0. 8439H 0-80.6456
四、实验结论
(一)
关于计量方法的结论
1. 有关虚拟变量的结论 虚拟变量具有以下作用:
(1) 能够正确反映经济变量之间的相互关系,提高模型的精度。相当于将不同属性的样本合并,扩大了样本容量(增加了误差自由度,从而降低了误差方差)。 (2) 检验不同属性类型对因变量的作用,例如工资模型中的文化程度、季节对销售额的影响。在这篇文章中的性别因素对身高和体重的影响。
第13页
(3) 便于处理异常数据;当样本资料中存在异常数据时,一般有三种处理方式,一是在样本容量较大的时候直接剔除异常数据;二是用平均数方式修匀异常数据;三是设置虚拟变量:
(4) 可以描述和测量定性因素的影响。在本文中,性别作为虚拟变量发挥了重大作用,它检验了男女不同属性类型对身高的影响,也大大提高了本次分析结果的精度。由于虚拟变量的引入方式有多种,包括加法引入、乘法引入以及混合引入等,不同的引入方法也会有不同的改善效果。
本文中引入性别虚拟变量来区分不同性别在身高对体重影响的影响。
(二) 关于实验结果的结论 1. 在三班数据简单回归模型:
我们得到α0=-105. 5248,α1=0. 9829,其中α0表示截距项,意味着身高与体重之间存在着一个常数的关系,它不会随着身高的改变而改变,α1则表示随着同学们的平均身高增加1厘米,同学们的平均体重会增加0.9829公斤。在显著性检验中,α0=0、α1=0均被显著拒绝,这说明身高对体重的影响还是有显著性效果的。从可决系数R 2=0.6413来看,本模型的拟合程度并不高。
2. 在四个班数据简单回归模型:
我们得到β0=-124.1379,β1=1. 0885,其中β0表示截距项,意味着身高与体:之间存在着一个常数的关系,它不会随着身高的改变而改变,β1则表示随着同学们的平均身高增加1厘米,同学们的平均体重会增加1.0885公斤。在显著性检验中,β0 =0、β1 =0均被显著拒绝,这说明身高对体重的影响还是有显著性效果的。从可决系数R 2=0.6067来看,本模型的拟合程度并不高。。
3. 在四个班数据加入性别虚拟变量回归模型:
(1)在加法模型中:对β0、β1、β2分别作显著性检验时得到三者均显著
0.. 8408H 0-84.5449 S =0ˆ=⎧不为零,于是函数关系为W ,这就表示对女生来说⎨0
H 0-80.1370 S =1⎩0. 8408平均身高每增高1厘米,平均体重将会增加0.8408公斤,同样的对男生来说平均身高每增高1厘米,平均体重也将会增加0.8408公斤。但二者的截距项并不相同,从数值上来看女生的截距项低于男生,这也比较符合实际。但从R 2=0.6247来看,本模型拟合优度也不高,仍有很大改进空间。男生女生在身高完全相同时,男生体重比女生体重多四公斤。
第14页
(2)在乘法模型中:对β0、β1、β2分别作显著性检验时得到三者均显著
0.. 8167H 0-80.6456 S =0ˆ=⎧不为零,于是函数关系为W ,这就表示这就表示对⎨0
S =1⎩0. 8439H 0-80.6456女生来说平均身高每增高1厘米,平均体重将会增加0.8167公斤,同样的对男生来说平均身高每增高1厘米,平均体重也将会增加0.8439公斤,这貌似也很符合现实。但二者截距项相同,并不能很好的符合实际。但从R 2=0.6258来看,本模型拟合优度也不高。男生身高每增加一公分,体重比女生多增加0.03公斤。
第15页