山大网络教育专升本统计学答案
统计学 一. 单项选择填空 1.“统计”一词的基本含义是 D. 统计科学。统计工作。统计资料 2.某企业职工的工资分为四组:(1)800元以下;(2)800~1000元;(3)1000~1500元;(4)1500元以上,则第4组组中值应为 C.1750元
3.若两数列的标准差相等而平均数不等,则B. 平均数大代表性大 4.假设检验的基本思想可以用( C )来解释C. 小概率事件原理 5.在回归分析中,两个变量( A. 因变量是随机变量
1.统计学是一门收集`,整理和分析统计数据的 C 方法论科学 2. 受人们主观认识影响较大的调查是( A .典型调查 3. 计算平均比率最好用(C. 几何平均数
4. 用简单随机重复抽样方法选取样本单位,如果要使抽样平均误差降低50%,则样本容量需要扩大到原来的( B )倍。 B. 4
5. 按季平均法测定季节比率时,各季的季节比率之和应等于( B )B. 400% 1.要了解全国居民家庭的收支情况,最适合的调查方式是( D ) D 抽样调查 2. 如果数据分布很不均匀,则应编制( B )B. 不等距数列 3. ( D )完全不受极端数值的影响。 D.众数和中位数
4. 抽样平均误差反映样本指标与总体指标之间的( C ) C. 平均误差程度 5. 在线性回归模型中,随机误差项被假定服从( A . 正态分布 二. 判断题
1.定距尺度的计量结果可以进行加,减,乘,除运算。 (错) 2.各变量值与其均值离差之和为零。 (对) 3.同样条件下,重复抽样的抽样误差一定大于不重复抽样的误差。(错) 4.同度量因素在综合指数的编制中只起媒介作用。 (错) 5.当相关系数r=0时,变量之间不存在任何相关关系。 (错) 2. 各变量值的次数相同时,众数不存在。 (对)
3. 平均增长速度是环比增长速度连乘积的n 次方根。 (错) 4. 总值指数既可以视为总指数,也可以视为个体指数。 (对)
5. 样本相关系数与回归系数的符号,可以相同也可以不相同。 (错)
1. 峰度系数大于1时为尖峰分布。 ( 错 ) 2.F 分布总是正偏分布。 ( 对 ) 3. 假设检验的显著性水平 ,就是犯第一类错误的概率。 ( 对 ) 4. 变量之间的相关关系和函数关系,在一定条件下可以互相转化。( 对 ) 三. 填空
1.从统计方法的构成来看,统计学可以分为( 描述统计 )和( 推断统计 ) 2.频数分布的主要类型有正态分布,( 偏态分布 ),J 型分布和(U 型分布 ) 3.评价估计量优劣的标准有(无偏性),(有效性)和一致性。 4.假设检验的两类错误,第一(弃真错误),第二(纳伪错误) 5.相关关系按相关程度可以分为:完全相关,(不完全相关)和(不相关) 1. 统计表一般由表头,行标题,(列标题)和(数字资料)构成。 2. 抽样框的主要形式有(名单抽样框),区域抽样框和(时间表抽样框)
3. 单因素方差分析中平均方差的计算公式,
4. 相关系数按相关方向划分可分为(正相关)和(负相关)
5. 时间序列的基本要素,一是(被研究现象所属的时间范围)二是(反映该现象一定时间条件下数量特征的数值)
2. 统计表的设计应符合科学,(实用),简练,(美观 )的要求。
3. 根据排队标志的性质不同,等距抽样分为(无关标志排队等距抽样)和(有关标志排队等距抽样 ) 4. 相关关系按相关形式可分为( 线性相关)和(非线性相关 ) 5. 测定季节变动的方法主要有(原始资料平均法)和(趋势剔除法)
名词解释
1. 统计学:是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。 2. 中位数:数据排序后,位置在最中间的数值。
3. 统计分组:是统计整理的第一步,是按照统计研究的目的,将数据分别列入不同的组内。
4. 抽样平均误差:是抽样平均数(或抽样成数) 的标准差, 它反映抽样平均数(或抽样成数) 与总体平均数(或总体成数) 的平均差异程度。
5. 动态指数:又称为时间指数,是将不同时间上的同类现象水平进行比较的结果,反映现象在时间上的变化过程和程度。
1. 普查:为某一特定目的,专门组织的一次性全面调查,是摸清国情国力的重要调查方法
2. 抽样框:对所调查的总体的全部构成单位进行编号排列形成的一套清单。它是抽取样本的基础资料 3. 相关分析:分析变量之间是否存在相关关系,明确其相关关系的类型,计算其相关关系的密切程度的统计分析方法
4. 方差分析:检验多个总体均值是否相等的统计方法
5. 综合评价指数: 依据指数分析的原理对多项指标进行综合对比,最后得到的概括性的单一评价指标 1. 推断统计学:是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。
2众数:是将数据按大小顺序排队形成次数分配后,在统计分布中具有明显集中趋势点的数值,是数据一般水平代表性的一种。
3、显著性水平:表示Ho 为真时拒绝Ho 的概率,即拒绝原假设所冒的风险,用a 表示。
4. 回归分析:就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。
5. 长期趋势:指现象在一段相当长的时期内所表现的沿着某一方向的持续发展变化。论述区间估计与假设检验的关系。
论述拉氏指数与帕氏指数的差异。 参考答案: 要点:1. 由于拉氏指数和帕氏指数选取的同度量因素不同,即使运用同样的资料计算的结果也存在差异,只有两种情况例外,第一,所有个体指数都相等第二,权数的结构保持不变。 2. 拉氏指数与帕氏指数的差异表明它们具有不完全相同的经济分析意义,孰优孰劣并无绝对的判别标准。 3. 拉氏指数与帕氏指数的差别是有一定规则的,在现实经济生活中,依据同样资料计算的拉氏指数一般大于帕氏指数。
论述假设检验的步骤 答:(1)提出原假设和备择假设。(2)选择适当的统计量,并确定其分布形式。(3)选择显著性水平a ,
确定临界值。(4)作出结论。
论述区间估计与假设检验的关系。 . 要点:(1)区间估计通常求得的是以样本估计值为中心的双侧置信区间,而假设检验不仅有双侧检验也常常采用单侧检验。(2)区间估计立足于大概率,通常以较大的把握去估计总体参数的置信区间。而假设检验立足于小概率,通常是给定很小的显著性水平去检验对总体参数的先验假设是否成立。(3)二者都是根据样本信息对总体参数进行推断,都是以抽样分布为理论依据,都是建立在概率基础上的推断,推断结果都有一定的可信程度或风险。(4)对同一实际问题的参数进行推断,使用同一样本,同一统计量,同一分布,二者可以相互转换,形成了区间估计与假设检验的对偶性。
计算题 1. 某企业生产某种产品的工人有1000人,某日采用不重复抽样抽取100人调查日产量,样本人均产量为35件,产量的样本标准差为4.5件,试以95.45%的置信度估计平均产量的抽样极限误差和置信区间。
1. 解:S=4.5 n=100 属于大样本,故
σ(x ) =
S 2n 4. 52100(1-) =(1-) ≈0. 43(件) n N 1001000
又已知 1-α=0. 9545,则Z α2=2
∆x =Z ασ(x ) =2⨯0. 43=0. 86(件)
平均产量的置信区间为:35-0. 86≤μ≤35+0. 86,即在34.14至35.86件之间。
2. 设销售收入X 为自变量,销售成本Y 为因变量,现已根据某公司12个月的有关资料计算出以下数据
(单位:万元)
∑(X t -X ) 2=425053. 73Y =549. 8
∑(Y t -Y ) 2=262855. 25
X =647. 88
∑(X t -X )(Y t -Y ) =334229. 09
要求(1)拟合简单线性回归方程
(2)计算可决系数和回归估计的标准误差。 2. 解:(1)β2=
∧
∧
∧
∑(X t -X )(Y t -Y ) ∑(X t -X ) 2
=
334229. 09
=0. 7863
425053. 73
β1=Y -β2X =549. 8-0. 7863⨯647. 88=40. 37
Y t =40. 37+0. 7863X t
∧
(2)∑Y t =∑(Y t -Y ) 2+n Y =262855. 25+12⨯549. 82=3890215. 73
2
2
∑X t Y t =∑(X t -X )(Y t -Y ) +n X Y =334229. 09+12⨯647. 88⨯549. 8=4608682. 178
∑e =∑Y t -β1∑Y t -β2∑X t Y t
=3890215. 73-40. 37⨯12⨯549. 8-0. 7863⨯4608682. 178=63. 82∑e t 263. 82S ===7. 9775
n -210-2
2
2t
2
∧∧
S=7. 9775=2.8244
r 2=1-
SSE 63. 82
=1-=0. 99976 SST 262855. 25
3. 某国有商场
又知上年12
a a 185107
+a 2+ +n +75+81+ +103+
==93. 4(人) 3. 解:a =n -112
4.
4. 解:
∑p 1q 1∑p 1q 1∑q 1p 0
=⨯
∑p 0q 0∑p 0q 1∑q 0p 0
[**************]00
=⨯
[**************]
202.15%=166.77%⨯121.21%
160100-79200=(160100-96000)+(96000-79200) 80900=64100+16800
分析:由于出口价格上升66.77%,影响出口总额增加64100美元,由于出口量增加21.21%,影响出口总额增加16800美元,两者共同影响的结果使出口总额增长102.15%,即增加80900美元。
5. 某厂日产某种电子元件2000只, 最近几次抽样调查所得产品不合格率分别为4.6%,3.5%,5%.现在为了调查产品不合格率, 问至少应抽查多少只产品, 才能以95.45%的概率保证抽样误差不超过2%.
5. 解:N=2000 ∆p =2%1-α=95. 45Z α=2
2
选取方差最大值 P(1-P)=5%×95% 在重复抽样条件下:
n =
Z 2αP (1-P )
=22⨯0. 05⨯0. 95
∆2p
0. 02
2
=475(只) 再不重复抽样条件下:
n =Z 2α2P (1-P )
22⨯0. 05⨯0. 95
∆2Z 2(1-P ) =22
⨯0. 05⨯0. 95
≈384(只) αP p +
N
0. 022+2000
6. 根据七个地区增加值(X)和财政收入(Y)的有关资料计算出以下数据(单位:万元)
∑X 2t =185∑Y t =80∑X t Y t =2180
∑X t =5003∑Y 2t =954
(1)计算相关系数
(2)拟合简单线性回归方程(本题8分) 6. 解:(1)
r =
n ∑X -∑X t Y t t ∑Y t
7⨯2180-185⨯80n ∑X
2t
-(∑X t )
2
n ∑Y 22
=
t -(∑Y t )
7⨯5003-185
2
7⨯954-80
2
=0. 978β∧
n ∑X t Y t -∑X t ∑Y t 2180-185⨯80
2=
n ∑X 2
t -(∑X t ) 2
=
7⨯7⨯5003-185
2
=0. 578 β∧
=∑Y t n -β∧∑X t 8018512n =7-0. 578⨯7
=-3. 844
Y ∧
t =-3. 844+0. 578X t
7.
7. 解:c =
a ∑a ∑b 144. 0+148. 2+154. 757b
=n ÷n =. 6+49. 4+49. 93÷3=2. 848(次) (2)
8.
8. 解:L p =
∑p 1q 0480800
==104. 57%
∑p 0q 0459800
L q =
∑q 1p 0495960
==107. 86%
∑q 0p 0459800
∑p 1q 1516580
==104. 16%
∑p 0q 1495960
∑q 1p 1516580
==107. 44%
∑q 0p 1480800
P p =
P q =
9. 某地区粮食播种面积共5000亩,按不重复抽样方法抽取100亩实测,平均亩产450公斤,标准差52公斤。试以95%的置信度估计该地区平均亩产和总产量的区间。 解:S =52
n =100
N =5000
σ(x ) =
S 2n 522100(1-) =(1-) ≈5. 15(公斤) n N 1005000
Z =Z 0. 025=1. 96
1-α=0. 95
粮食平均亩产的置信区间 :450-10≤μ≤450+10 即在440至460公斤之间 总产量的置信区间:440⨯5000≤N μ≤460⨯5000 即在2200000至2300000公斤之间
10. 根据15户居民的人均月食品支出(X )与人均月收入(Y )的有关资料计算出以下数据(单位:元)
∑X t =1516. (1) (2) 解:(1)β2=
∧
∧
∑Y t =423
∑X t Y t =44632∑X t 2=163654∑Y t 2=12311拟合简单线性回归方程。
计算可决系数和回归估计的标准误差
∧
n ∑X t Y t -∑X t ∑Y t 15⨯44632-1516⨯423
==0. 1802 222
n ∑X t -(∑X t ) 15⨯163654-1516
β1=Y -β2X =423÷15-0. 1802⨯1516÷15=9. 9872 回归方程为:Y t =9. 9872+0. 1802X t
(2)∑e =∑Y t -β1∑Y t -β2∑X t Y t =12311-9. 9872⨯423-0. 1802⨯44632=43. 47
∑e t 243. 47
S ===3. 3438S =S 2=. 3438=1. 8286
n -215-2
2
∧
2t
2
∧∧
(∑Y t ) 2
SST =∑Y t -=12311-4232÷15=382. 4
n
2
r 2=1-
SSE 43. 47
=1-=0. 8863 SST 382. 4
11. 某地区1999年下半年各月的社会劳动者人数和国内生产总值资料见下表:
又知1999率。
∑a 1950
==325(亿元)解:a =n 6
a a 116802100
+a 2+ +a n -1+n +1800+1760+1860+1920+2060+
==1881b =. 67(万人)
n -17-1
下半年月平均劳动生产率为:
c =
a 325==0. 17272(亿元/万人)=1727.2(元/人) 1881. 07b
12.
解:L p =
∑p 1q 02196. 8
==107. 73%
∑p 0q 02039. 2
L q =
∑q 1p 02124==104. 16%
∑q 0p 02039. 2∑p 1q 12281
==107. 39%
∑p 0q 12124
∑q 1p 12281
==103. 83%
∑q 0p 12196. 8
P p =
P q =