当前位置：首页 >> 范文 >> 数理统计大作业(北航)2014版

数理统计大作业(北航)2014版

10-22

应用数理统计

大作业一

学院：学号：姓名：指导老师：

2014年12月21

日

XXXXXXX XXXXXXX XXX XXX

国民生产总值增量的多元线性回归模型

摘要：国民生产总值一直是衡量国家综合经济水平的重要指标，本文要讨论研

究的是国民生产总值的增量趋势与各产业增值趋势间的多元线性关系[1]。本论文搜集了我国从1998至2012年15年的国民生产与各产业增量指标，拟定数个自变量，代入统计软件SPSS 19.0[2]对各影响因素进行了统计分析，综合分析结果模拟多元线性回归函数。模型建立之后，又将2013年数据作为测试集测试模型的拟合精确度，得到的结果达到预期值，得出模型建立较为成功。

关键词：逐步回归法，国民生产总值增量，线性拟合

一引言

国民生产总值（Gross Domestic Product ）是在一定时期中，一个国家地区经济生产出的全部最终产品和劳务的价值，被公认为衡量国家经济状况的较佳指标。它不仅仅反映了一定的经济表现，还可以反映国家的综合国力与经济发展前景，作为经济政策的制定依据，研究我国的国民生产总值的制约因素成为了学者们的热点问题。下文就以1998年至2012年的统计数据为标准，利用SPSS 软件作出了多元线性回归分析。

二统计分析 2.1变量说明

因变量 Y —— 国民生产总值增值（亿元）；自变量 x1 —— 第一产业增加值（亿元）自变量 x2 —— 第二产业增加值（亿元）自变量 x3 —— 第三产业增加值（亿元）自变量 x4 —— 工业增加值（亿元）自变量 x5 —— 建筑业增加值（亿元）

2.2统计数据

国民生产总

训练组

值增值(亿元) 加值(亿元)

2012年 2011年 2010年 2009年 2008年 2007年 2006年 2005年 2004年

46366.05 71591.25 60609.99 26857.38 48235.12 49495.88 31377.06 25059.03 24055.58

52373.63 47486.21 40533.6 35226 33702 28627 24040 22420 21412.73

加值(亿元) 235161.99 220412.81 187383.21 157638.78 149003.44 125831.36 103719.54 87598.09 73904.31

加值(亿元) 231934.48 205205.02 173595.98 148038.04 131339.99 111351.95 88554.88 74919.28 64561.29

(亿元) 199670.66 188470.15 160722.23 135239.95 130260.24 110534.88 91310.94 77230.78 65210.03

值(亿元) 35491.34 31942.66 26660.98 22398.83 18743.2 15296.48 12408.61 10367.31 8694.28

第一产业增

第二产业增

第三产业增

工业增加值

建筑业增加

2003年 2002年 2001年 2000年 1999年 1998年

15490.07 10677.52 10440.62 9537.5 5274.77 5429.25

17381.72 16537.02 15781.27 14944.72 14770.03 14817.63

62436.31 53896.77 49512.29 45555.88 41033.58 39004.19

56004.73 49898.9 44361.61 38713.95 33873.44 30580.47

54945.53 47431.31 43580.62 40033.59 35861.48 34018.43

7490.78 6465.46 5931.67 5522.29 5172.1 4985.76

表格2-1 1998~2012年训练集数据

国民生产总

测试组

值增值(亿元) 加值(亿元)

2013年

49375.11

56957

加值(亿元) 249684.4

加值(亿元) 262203.8

(亿元) 210689.4

值(亿元) 38995

第一产业增

第二产业增

第三产业增

工业增加值

建筑业增加

表格2-2 2013年测试集数据

[3]中收录的近15年全国国民生产总值以上数据来自《中国统计年鉴2013》

增值数据，考察与各产业间增量趋势变化中关系密切并且直观上有线性关系的因素，因此选取了第一产业增值、第二产业增值、第三产业增值、工业总产值增值、建筑业增值五大因素为自变量。

2.3模型建立

建立多元线性模型：

Y =α1x1+α2x2+α3x3+α4x4+α5x5

将以上数据数据录入SPSS 。

2.3.1 自变量与因变量关系

利用SPSS 统计分析得到各自变量与国民生产总值增值的散点图：

图2-1国民生产总值增值与第一产业增加值的散点图

图2-2国民生产总值增值与第二产业增加值的散点图

图2-3国民生产总值增值与第三产业增加值的散点图

图2-4国民生产总值增值与工业增加值的散点图

图2-5国民生产总值增值与建筑业增加值的散点图

由以上数据我们可以看出各产业的增量与国民生产总值增量的散点图都比较相似，因此无法直观地排除无关变量。

下一步，我们用SPSS 自带的逐步回归分析法作进一步研究：

输入／移去的变量

a

模型 1

输入的变量工业增加值(亿元)

移去的变量

方法 F-to-enter 的概率

率 >= .100）。

2

第三产业增加值(亿元)

. 步进（准则: F-to-enter 的概率

率 >= .100）。

a. 因变量: 国内生产总值增值(亿元)

. 步进（准则:

图2-6 变量排除结果

在模型建立中，SPSS 将第一产业与第二产业以及建筑业产业增值都剔除了，

而保留了工业和第三产业的产业增值，由此可见，在五个自变量因素中，工业与第三产业的增量与国民生产总值增量的关联度较高，为目标函数提供的贡献度较大。因此，在以下的模型建立中，我们保留了这两个因素作为拟合自变量。

2.3.2 模型方案的建立

由以上结果我们可以看出，系统提供给我们两个最终拟合方案。方案一：以工业增加值为自变量得到拟合函数

Y =0.339x4−2593.808

方案二：以工业增加值和第三产业增加值为自变量得到拟合函数：

Y =−1.303x3+1.835x4−14838.847

除了模型具体参数值，以下系统还给出了两模型方案的回归、残差分析表格，得出了其残差平方和与均方平方和数值：

从结果可以得到，两个回归模型的F 值分别为59.268与74.499，根据F 分布表格，易查得，方案二的回归显著性更高。

因此我们选用模型二的拟合函数作为最终输出结果。

下面是回归标准化残差图：

图2-9 回归残差结果

我们利用2013年数据进行拟合测试：

方案一：

1=0.339∗210689.4−2593.808=68829.986 Y

方案二：

Y 2=−1.303∗262203.8+1.835∗210689.4−14838.847=30124.652 实际输出为：

Y =49375.11

可以看出，两个模型与实际结果的误差仍然较大，相比之下模型二更接近实际输出，但是仍不满足我们预期的结果，超出误差范围很大。因此此模型建立得不够完善，或者说，模型中自变量与因变量的线性关系仍不明显。

三结果分析

由于软件所建立模型在测试过程中仍然误差较大，所以可以得出这样的结论：本模型中自变量第一产业增加值、第二产业增加值、第三产业增加值、

工业增加

值、建筑业增加值与因变量国民生产总值增值之间的线性关系不明显。但综合来看，模型二较为可靠：

Y =−1.303x3+1.835x4−14838.847

参考文献

[1] 孙海燕, 周梦, 李卫国, 冯伟. 应用数理统计[M]. 北京:北京航空航天大学数学系, 2014.

[2] 张建同, 孙昌言. 以Excel 和SPSS 为工具的管理统计[M]. 北京:清华大学出版社，2002.

[3] 国家统计局.2010年中国统计年鉴[M]. 中国统计出版社，2013.

与《数理统计大作业(北航)2014版》相关的范文

09-23 参评"五四奖章"事迹材料:追梦不息奋斗不止

参评“五四奖章”事迹材料:追梦不息奋斗不止章xx，男，中共党员，1992年生于一户普通家庭，20XX年进入xx大学航空科学与工程学院，现已免试保送本校继续攻读飞行器设计专业。他在本科四年的时间内，持续追逐自己的航空梦，不断奋斗在学生工作、科技创新、社会实践、志愿服务等多个领域，持续影响、服务着同学和北航校园。大学是一个多元化的“准社会”，作为一个“准社会人”，章xx总是乐于为身边的同学、为学校 ...

07-03 2014年大学生暑期三下乡社会实践报告

20XX年大学生暑期三下乡社会实践报告 -点亮希望火种开启幸福之门为进一步落实我校<关于组织开展20XX年暑期文化.科技.卫生"三下乡"社会实践活动的意见>的文件精神,为构建设社会主义和谐社会.建设社会主义新农村贡献一份力量,也为丰富大学生的假期生活和社会实践经验,按照校团委的统一部署,xx大学xx爱心社于7月8日至7月19日在新乡.商丘开展了暑期支教实践,帮助扶 ...

10-07 2013年-2014年第二学期六年级数学教学工作计划

20xx-20xx第二学期六年级数学教学工作计划学习对象分析：本班学生上册应掌握的知识基本掌握较好，尤其是分数计算方面准确率较高，但在实际应用类，如应用题，还有个别学生对题目难以理解，解题困难。大部分学生学习较主动，能自觉进行课后复习、课前预习，课堂上发言较积极，但有个别学生依赖性较强，思维能力和分析能力都较差，听课时较易分神，学习成绩较不理想。同时，本班同学学习习惯大多较好，课堂听课认真，作业 ...

01-24 黟县实验小学2014年第一学期期末结束工作安排

（第20-23周即1月11日-2月5日） 1. 各任课教师自查教学进度，圆满完成教学计划（非语文、数学、英语学科1月15日前考试结束，考试结束后各班课程仍由各任课教师承担）。（教导处） 2. 教师着手“备好课远程学习”网上作业。（办公室） 3. 晚上召开全体教师会议。（雨天延后） 4. 21周停止大课间活动。 5. 各班开展“巧复习，创佳绩”主题班会。（1月13日）（少先队） 6. 各组、部门、全 ...

02-09 2013年-2014年学年度二年级下期数学教学计划

20xx-20xx学年度二年级下期数学教学计划指导思想：本期数学教学仍以新课标精神为指导，注重有创新、开放精神的主动学习，同时，努力培养学生严谨、塌实的优良习惯，从而达到二年级应掌握的知识、技能以及情感、态度价值观的要求。学生情况分析：本年级学生40人，家住学校附近。家庭学习环境良好，家长有一定辅导能力的约占50%，其余学生全靠课堂教学进行数学学习。总体来看，学生在100以内的加减法，表内 ...

03-16 小学2014开学流程

小学2014开学流程一．2.14下午3:00： 1.学校领导开会。 2.商议学校课程分配等情况。 3.打扫办公室·清洁区，进行安全排查。二．2.15下午3:00： 1.全体教师会。 2.领取各班教材、教科书。 3.整理教室卫生、布局。 4.谈本学期学校计划精神。三．2.16上午： 1.迎接同学入校、布置标语。 2.收回《告家长书》，总结家长建议。 3.分发教材、检查作业。 4.布置班级事务。 ...

02-22 2014年度下期八年级数学下册教学计划

20xx学年度下期八年级数学下册教学计划一、学生基本情况：八年级五班总人数为33人，均为男生。其中彝族学生32人，占总人数的98﹪。从上期学生期末考试的情况来看，成绩在前面的基础上还有所倒退。对大部分学生来说，简单的基础知识还不能有效的掌握，成绩较差，在几何中，由于缺少三角形全等与勾股定理的相应知识，学生在推理上的思维训练有所缺陷，学生对四边形中的相应的数量关系缺少更深入的认识。对很多孩子来说 ...

02-28 2014年度上学期二年级班主任工作.语文教学.数学教学计划

20xx-20xx学年度上学期二年级班主任工作、语文教学、数学教学计划二年级班主任工作计划一、班级基本情况和目标：　　我班共有学生28人。本学期我班的基本目标是：全体同学都能树立明确的学习目的，形成良好的学习风气；继续抓好学生的常规教育，强化《小学生日常行为规范》的落实，培养学生良好的行为习惯。培养学生强烈的责任感、班级荣誉感，以及自我约束，自我管理的能力。　　二、基本措施和做法：　　1 ...

06-04 2014年中小幼教师远程研修实施方案

为加快唐山市中小幼教师队伍建设，全面提升教师队伍整体素质，提高教育水平和质量，推进素质教育实施，根据唐山市教育发展的需求，经研究决定利用现代网络手段开展“20XX年唐山市中小幼教师学科提高远程研修”，具体实施方案如下：一、培训目标 1．通过培训提高教师的课堂教学水平和科研水平，强化学科教学能力和信息技术能力。 2．在培训过程中充分利用国家级培训资源，开发地方研修资源；充分利用唐山市教师进修信息中 ...

05-11 2014年五年级数学下学期教学工作总结

一学期来，本人认真备课、上课、听课、评课，及时批改作业、讲评作业，做好课后辅导工作，广泛涉猎各种知识，形成比较完整的知识结构，严格要求学生，尊重学生，发扬教学民主，使学生学有所得，不断提高。一、知识掌握方面：　　1、学生初步学会了数据的收集和整理的方法，会看和制作简单的统计表，通过有说服力的数据和统计材料，使学生受到爱祖国、爱社会主义、爱科学的教育，学会较复杂的求平均数的方法。　　2、学生知道 ...

随机推荐

猜你喜欢