统计学课后作业答案
《统计学》各章参考答案
第一章 导论
一、选择题
1.C 2.A 11.A 12.C 21.D 22. A 31.C 32.A 三、练习题1. (1)所关心的总体是制造商生产的一批产品 (2)样本是 (3)参数是产品不合格率低于 (4)统计量是不合格的2. (1)总体是网上购物的消费者 (3)所有网上购物的消费者每月在网上购物的平均花费 (4)统计量3. (1)分类变量(4)顺序型变量
一、选择题1.A 2.B 11.C 12.A 21.A 22.B 二、判断题1. ∨ 2. ∨ 一、选择题1.C 2.A 3.B 3.C 4.C 5.C 6.B 7.A 8.D 9.C 10.D 13.C 14.A 15.B 16.A 17.C 18.B 19.D 20.A 23.B 24.C 25.A 26.A 27.A 28.B 29.A 30.D 33.B
100个产品
10% 6%
(2)分类变量
(2)数值型变量 (3)顺序型变量 第二章 数据的收集
3.A 4.D 5.B 6.C 7.D 8.D 9.D 10.C 13.D 14.D 15.C 16.A 17.D 18.C 19.B 20.B 23.C 24.A 25.B 26.B 27.A 28.B 29.D
3. × 4. ∨ 5. × 6. × 7. ∨ 8. × 9. ×
第三章 数据整理与显示
4.C 5.D 6.C 7.B 8.B 9.A 10.B 11.B 12.A 13.C 14.B 15.D
16.D 17.D 18.B 19.C
第四章 数据分布特征的测度
一、选择题
1.A 2.C 3.B 4.C 5.D 6.D 7.A 8.B 9.A 10.B 11.A 12.C 13.C 14.C 15.D 16.A 17.A 18.B 19.A 20.B 21.A 22.A 23.B 24.C 25.C 26.D 31.C 32.D
二、判断题
1. × 2. ∨ 3. × 4. × 5. × 10. ∨
三、思考题
2、中位数,分布是偏态的,存在极端值,中位数表示中等收入3、寻找众数
6、方差不可能是负数
7、C 最大,B 最小,从数据分布分散程度来看的8、900元合适,因为它是中位数 9、选择B ,因为它的极差小
四、计算题
k
∑x
i
f i
1. =1甲
=
i k
=
3990f 54
=73.89
∑
i
i =1σ甲=
=
=11.96
υσ甲
甲==
11. 96=16. 17%
甲
73. 89νσ
乙
9. 93乙=
=
73. 8
=13. 45%
乙
16.17%>13.45% 乙的代表性强
27.D 28.A 6. × 7. ∨ 29.D 30.C 8. × 9. ×
k
∑x
2. 0.25=
i =1k
i
f i
=0.966
∑
i =1f i
σ0.25=
=0.056
ν0.25=
k
σ
⨯100%=
0.0560.966
⨯100%=5.834%
∑x
1=
i =1k
i
f i
=4.534
∑
i =1f i
σ1=
=0.1295
ν1=
σ
⨯100%=
0.12954.534
⨯100%=2.857%
该教练的说法不成立。
k
∑x
3. (1) x 甲=
i =1k
i
f i
=1168
∑
i =1
k
f i
∑x
x 乙=
i =1k
i
f i
=1252
∑
i =1
f i
1168
∑(x
(2)s 甲=
i =1
k
k
i
-)f i
2
==154. 44
f i -1
∑
i =1
k
∑(x 2
i
-)f i
s =1
乙=
i =143. 20k
∑
f i -1
i =1
υs 甲甲==
154. 44=13. 22%
甲1168νs 乙143. 20
乙=
=
乙
1252
=11. 44%
13.22>11.44,所以甲长元件耐用时间差异大
k
4. =
∑
x f i
i
k
=14.99 i =1
∑
f i
i =1
σ=
=
=1.67
5. G =1=
1
30
∑x
i
6. (1)=
i =1
n
=224. 07
M
e
=223. 5
(2)将所以数据由高到低排序
Q +1l 的位置=
n 4
=314=7. 75
Q l =207+(208-207) ⨯0. 75=207. 75
Q u 的位置=
3(n +1)4
=23. 25
Q u =241+(242-241)⨯0. 25=241. 25
R =最大值-最小值=272-186=86
(3)Qu -Q l =241. 25-207. 75=33. 5
94.28%=
k
∑(x
i
-)
2
σ=
i =1
n
=21. 60
k
∑x
i
f i
7. =
i =1k
=5.83
∑
f i
i =1σ=
=
=2.075
ν=
σ
⨯100%=
2.0755.83
⨯100%=35.59%
k
∑x
i
f i
8. =
i =1k
=20.38
∑
f i
i =1σ=
=
=10.87
偏度系数:
SK =
m 3
σ
3
=
1363.254
(10.87)
3
=1.0614
峰度系数:
K =
m 4
σ
4
-3=
55391.62
(-3=0.9676
10.87)
4
计算结果表明,偏度系数略大于1,说明该产品使用寿命的分布十分接近对称分布;峰度系数几乎为1,说明该产品使用寿命的分布要比正态分布略微平坦一些。总的来讲,该产品使用寿命的分布非常接近正态分布。 9. 乙班的考核结果明显好于甲班。
从离散系数看,乙班为4.04%,甲班为12.85%从分布来看,乙班基本为正态或钟型分布,甲班明显为左偏分布。 10.(1) 计算均值和标准差系数来评价优劣
,甲班为36;;从极差来看,乙班为11
(2) A =165. 6 B =128. 73 C =125. 53 ν
=s A A
=2. 13165. 6
=1. 29% ν
=s B B
=
1. 75128. 73
=1. 36% νC =
s C C
=
2. 77125. 53
=2. 21%
A B
所以选择A
第五章 抽样分布与参数估计
一、选择
1.C 2.C 3.B 4.A 5.D 6.C 7.D 8.B 9.A 10.B 11.D 12.B 13.A 14.C 15.C 16.A 17.D 18.C 19.A 20.A 21.C 22.B 23.A 24.A 25.A 26.A 27.A 28.B 29.B
二、判断
√√×√×,××√××
三、思考题
5. 不可信,隐瞒了置信度和样本量 6. 不能,
7. 不合适,np=7,n (1-p )=3
四、计算题
⎛⎫⎛⎫
⎪ ⎪-μ-2005⎪ p (-μ≤5)=p ≤=p ≤1⎪=0. 68 σ⎪σ50 ⎪
⎪ ⎪
10⎝⎭n n ⎝⎭
2. (1)
⎛⎫⎛⎫
⎪ ⎪-μ-20010⎪ ≤=p ≤2⎪=0. 95(2)p (-μ≤10)=p
σσ⎪50 ⎪
⎪ ⎪
10⎝⎭n n ⎭⎝
3.n=80>30,大样本,因此用正态分布来估计置信区间
±z α
2
s n
=69. 6±1. 96
3. 580
(69.29,70.11)
4. p=240/400=0.6 ,np=240>5,n (1-p )=160>5,大样本,因此用正态分布来估计置信
区间
p ±z α
2
p 1-p n
(55.2%,64.8%)
5.p=20/1000=0.02,大样本,因此用正态分布来估计置信区间
p ±z α
2
p (1-p )⎛N -n ⎫
(0.86%,3.14 %)) ⎪ (
n ⎝N -1⎭
6. 首先计算平均每户居民的需求量
大样本,因此用正态分布来估计置信区间
(9.412, 10.588) s 9
±z α=10±1. 96
100n 2供应1000户,所以最少应准备10.588万kg
7. 已知N ,可以用两种方法 放回抽样
z ασn =
22
2
E
2
代入数据n=661
z ασN
2
2
n =
2
(N -1)E
2
2
+z ασ
2
22
代入数据n=707
z απ(1-π
)
其中π=0. 5 代入数据 n=385
1n 1
1⎤
⎥ 代入数据得置信区间(0.02,3.98)kg n 2⎦
p 21-p 2⎤
(-0.05%,10.05%) +⎥ 代入数据得置信区间为
n 2⎥⎦
8. n =
⎡⎣
2
E
2
9. ⎢(1-2)±z ασ
2
+
⎡
10. ⎢(p 1-p 2)±z α
⎢2⎣
p 11-p 1n 1
⎡22(n -1)s (n -1)s
, 11. ⎢22
⎢χαχ1-α
2⎣⎤
⎥ 代入数据得置信区间为(0.0147,0.0324) ⎥⎦
第六章 假设检验
一、选择题
1.A 2.A 3.C 4.C 5.D 6. C 7.A 8.C 9. A 10.A 11. B 12.A 13.A 14.A 15.B 16.C 17.A 18.D 19.A 20.B
二、判断题
×××√× ××√××
四、计算题
1. 小样本,方差已知,双侧检验。H 0:μ= 4.55
z c =
=
H 1:μ≠4.55。
=-1.833。z α/2=1.96,(P值=0.067),不拒绝原假设,可以认
为现在生产的铁水平均含碳量为4.55. 2. 大样本,方差未知,右侧检验。H 0:μ≤50
z c =
=
H 1:μ>50 。
(P 值=0.006),拒绝原假设,厂家声明不=2.527。z α=2.33,
可信。
3. 小样本,方差未知,右侧检验。H 0:μ≤53
=56.4, s =
3.738, t c =
H 1:μ>53。由样本数据得到,
=
(P 值=0.002),=3.523, t α(n -1) =1.761,
拒绝原假设,可以说平均每个调查员每周完成的调查次数大于53次。 4. H 0:π≤50%
z c =
=
H 1:π>50%。P=35/60=58.33%,
=1.290,z α
(P 值=0.099),不拒绝原假设,=z 0.05=1.645,
没有充分证据拒绝银行的声称。 5. 一个总体方差检验,右侧。H 0:σ
2
2
2
≤4
H 1:σ>4。χc =
2
2
(n -1)s
2
σ0
2
=
(10-1) ⨯4.8
4
=10.8。
不拒绝原假设,即可以认为该线路的运行时间稳定性达到了公χα(n -1) =χ0.05(9)=16.919,司的要求。
6. 独立样本的均值之差检验,双侧,大样本,方差未知。H 0:μ1-μ2=0
z c =
H 1:μ1-μ2≠
=
=-2.662,z α/2=1.96
,(P 值=0.008),拒绝原假设,
存在显著差异。
7. 两总体均值之差检验,匹配小样本。 H 0:μ1-μ2≥0
d =-7,
s d =
5.793,t c =
H 1:μ1-μ2
=
=-3.821。-t α(n -1) =-1.833,(P
值=0.002),拒绝原假设,健身课程有效。
8. 换题
9. 两总体方差比检验,双侧。H 0:
σ1σ
2
22
=1
H 1:
σ1σ
2
22
≠1。F c =
s 1s
2
22
=
2512
=2.083,
F α/2(n 1-1, n 2-1) =1.939,拒绝原假设,两个总体方差不相等。
第七章 方差分析
一、选择题
1.B 2.D 3.A 4.C 5.D 6.C 7.A 8.A 9.B 10.C 11.A 12.D 13.D 14.A 15.A 16.B 17.C 18.C 19.A 20.B 21.C 22.A 23.C 24.B 25.C 26.C 27.B 28.D 29.D 30.C 31.A 32.A 33.D 34.B 35.B 36.A 37.C 38.A 39.D 40.B
三、计算题
1、解:H 0:四个行业之间的服务质量相同;
H 1:四个行业之间的服务质量不完全相同。
则由Excel 表得:
方差分析
差异源 组间 组内 总计
SS df MS F P-value 1456.609 3 485.5362 3.406643 0.038765
2708 19 142.5263 4164.609 22
F crit 3.12735
因此F=3.41,由于F 0.05(3,19)=3.13
2、解:H 0:三个企业生产的电池的平均寿命相同;
H 1:三个企业生产的电池的平均寿命不完全相同。
则由Excel 表得:
差异源 SS df MS F 组间 615.6 2 307.8 17.06839 组内 216.4 12 18.03333 总计 832 14 P-value
0.00031 F crit 3.885294
因此F=17.07,F 0.05(2,12)=3.89
MSE=SSE/(n —k )=142.074 F=MSA/MSE=1.478
(2)H 0:三种方法组装的产品数量相同;
H 1:三种方法组装的产品数量不完全相同。
因为F 0.05(2,27) =3.35>1.478=F,因此不能推翻原假设,即不能认为三种方法组装的产品数量有显著差异。
4、解:行因素(品种):H 0:种子的品种对收获量没有显著影响;
H 1:种子的品种对收获量有显著影响。
列因素(施肥方案):H 0:施肥方案对收获量没有显著影响;
H 1:施肥方案对收获量有显著影响。
则由Excel 表得:
差异源 SS df MS F 行 19.067 4 4.76675 7.239716 列 18.1815 3 6.0605 9.204658 误差 7.901 12 0.658417 总计 45.1495 19 P-value
0.003315 0.001949 F crit 3.259167 3.490295
由于F R =7.24>F0.05(4,12)=3.26,所以拒绝原假设,即种子的品种对收获量有显著影响。 由于F C =9.20>F0.05(3,12)=3.49,所以拒绝原假设,即施肥方案对收获量有显著影响。 5、解:行因素(品种):H 0:地区对食品的销售量没有显著影响;
H 1:地区对食品的销售量有显著影响。
列因素(施肥方案):H 0:包装方法对食品的销售量没有显著影响;
H 1:包装方法对食品的销售量有显著影响。
则由Excel 表得:
差异源 行 列 误差 总计 SS df MS F 22.22222 2 11.11111 0.072727 955.5556 2 477.7778 3.127273 611.1111 4 152.7778 1588.889 8 P-value
0.931056 0.152155 F crit 6.944272 6.944272
由于F R =0.073
由于F C =3.13
第八章 相关与回归分析
一.单项选择题
1.D 2.C 3.C 4.D 5.D 6.D 7.C 8.D 9.D 10.A 11.A 12.C 13.D 14.C 15.D 16.C 17.B 18.A 19.B 20.C 21.C 22.C 23.B 24.A 25.A
三.计算题
1.(1)r =
2
n ∑xy -
n ∑x -
∑x ∑
y
2
(∑x )
2
n ∑y -
(∑x )
2
==-0. 91,两个变量有较强的负
相关关系。
(2)
ˆ=β1
n ∑x i y i -n ∑x
2
i ∑x ∑-(∑x )
i i
y i
2
=-1. 818
ˆ=-βˆ=77. 36β01
产量每增加1000件时,单位成本平均变动-1.818元。
(3)假定产量为6000件时,单位成本为66.44元。
n ∑xy -∑x ∑y
=0. 993 2.(1)r =
n ∑x -
2
ˆ=77. 36-1. 818x y
(∑x )
2
n ∑y -
2
(∑x )
2
(2)
ˆ=β1
n ∑x i y i -n ∑x
2
i ∑x ∑-(∑x )
i i
y i
2
=0. 074
ˆ=-βˆ=-7. 17β01
ˆ=-7. 17+0. 074x y
(3)s y =
3.(1)
∑(y
i
ˆi )-y
2
n -2
=
∑
2ˆˆy i -βy 1-βx i ∑y i
0∑1∑
n -2
=3. 126
方差分析表
df SS MS 回归分析 1 1602708.6 1602708.6 残差 10 40158.07 4015.807 总计 11 1642866.67
(2)R
2
F Significance F 399.1000065 2.17E-09
=
SSR SST
=
1602708. 61642866. 67
=0.97
由广告费用引起的销售额的变差变动的比例是97%
ˆ=363. 689+1. 42x (3) y
,
回归系数的含义是广告费用增加(减少)一个单位,销售额平均增加(减少)1.42
第九章 时间序列分析与预测
一. 选择题:
1.A 2.B 3.C 4.D 5.D 6.C 7.C 8.A 9.C 10.D
二. 判断题:
×××√× ×√×××
四. 计算题:
1..
较均方误差可知, 三期移动平均比α=0.2的指数平滑更适合预测. 计算可得, α=0.4的指数平滑预测的均方误差=22.53,所以比α=0.2的指数平滑更适合预测.
三期移动平均预测的均方误差=1.23, α=0.2的指数平滑预测的均方误差=3.56,所以三期移动平均更适合预测, 预测值为93.33%. 5.
三期移动平均预测的均方误差=0.12,四期移动平均预测的均方误差=0.14,所以三期移动平均预测更适合预测, 下一月预测值=99.63(元).
三期移动平均预测的均方误差=20.0, α=0.2的指数平滑预测的均方误差=27.8,所以三期移动平均更适合预测. 下一月的签约数预测值=26(套).
=0.3的指数平滑更适合预测, 第十一周的预测值=7.574. 8.
从图中看出,该地区空调销售量时间序列呈现线性增长趋势,设线性趋势方程为:ˆ=a +b ⋅t Y t
式中t 为时间变量,t =1代表2001年,t =2代表2000年,依次类推。
根据最小二乘法,
b =
n ∑ty -n ∑t
2
∑t ∑y -(∑t )
2
=0. 69
a =-b =75. 01
ˆ=75. 01+0. 69t 。 即趋势方程为:Y
ˆ=75. 01+0. 69t =75. 01+0. 69⨯7=79. 84,2007年的销售额预将t =7代入上式得. 即Y
测值是79.84万元.
b=0.69, 表示销售额平均每年增长0.69万元.
9.
销售额序列呈现出指数增长趋势.
将原销售额序列取自然对数得到对数销售额序列. 从右上图可以看出,对数保有量已经表现出线性增长趋势,因此,可以对对数保有量序列建立线性趋势模型。根据最小二乘法可以得到趋势方程:
ˆ) =1.57+0.29t ln(Y t
将t =12代入上述方程得ˆ) =1.57+0.29⨯12=5.00 ln(Y 12
ˆ=e 将其转换为保有量的预测值为:Y 12
2006年对数销售额的预测值:
ˆ) ln(Y 12
=e
5.00
=148.87(万辆)
10.
ˆ=78.25+0.27t , 其中, t =...... -3, -1,1, 3,...... 第8题趋势方程:Y t
ˆ) =3.29+0.29t , 其中, t =...... -2, -1, 0,1, 2,...... 第9题对数趋势方程:ln(Y t
11.
四个季度指数分别为:0.7669 1.1533 1.2179 0.8619 剔除季节变动后的序列为:
36.51 74.57 77.18 71.93 62.59 91.91 93.60 95.13 106.93 121.39 126.45 139.22 130.40 140.46 142.87 150.82 166.92 163.01 162.58 183.31 200.82 180.35 180.64 199.55 234.73 208.09 213.48 269.16
ˆ=45.96+6.74t , 其中, t =1, 2, 3,...... 对上述序列利用最小二乘法建立趋势方程: Y t
将t =29, 30, 31, 32代入上述趋势方程得2007年各季的趋势预测值, 241.51, 248.25,
255.00, 261.74
将上述预测值分别乘以四个季度指数0.7669, 1.1533,1.2179, 0.8619得最终的预测值,
185.20, 286.32, 310.56, 225.60
第十章 指数
一、选择题
1.D 2.C 3.A 4.C 5.D 6.D 7.C 8.C 9.A 10 C 11.B 12.B 13.B 14.A 15.A 16.A 17.A 18.D 19.B 20.D
三、计算题
1. (1)I ∑p 0q 1q =
∑p 0q =104. 52%
0(2)I ∑p 1q 1p =
∑
p =110. 74%
0q 1
2. (1) k q 甲=110% k p 甲=105% (2) I 1q =
∑
p 0q ∑p =114. 29%
0q 0(3) I ∑p 1q 1p =
∑
p =108. 15% 0q 1
3. (1)I p 1q 1p =
∑62% ∑1
=86. i p 1q 1
p
∑1
i p 1q 1
(2)I p
q =
∑
p =118. 15% 0q 0
∑
1i p 1q 1-
∑
p 0q 0=62. 06 p
4. I ∑p 1q 1pq =∑p
q =207. 43% 0
∑
p 1q 1-
∑
p 0q 0=37600 0
k q 乙=120
% k p 乙=112% p 0q 1-
∑
p 0q 0=25000
∑
p 1q 1-
∑
p 0q 1=16300
∑
p 11q 1-
∑
i p 1q 1=-54. 06
p
∑
p 1q 1
I ∑
p 0q 0
q =
I pq I =
p
I =118. 15%
p
∑
或
I q =
∑∑
p 0q 1p 0q 0
=172. 86% I p =
∑∑
p 1q 1p 0q 1
=120%
∑
∑∑∑
p 1q 1-p 1q 1p 0q 1p 1q
10
1
∑p -∑p -∑p -∑p
=
q 0=376000q 1=121000q 0=255000q 0=(∑p 1q 1-
⨯
∑p 0q 1) +(∑p 0q 1-∑
p 0q ) 0
∑p
∑p
q 1q 0
∑∑
p 1q 1p 0q 1
∑∑
p 0q 1p 0q 0
I pq =I p ⨯I q
从绝对数来看报告期销售额比基期销售额增加了376000元,是由于价格的提高使销售额增加了121000元和销售量的提高使销售额增加了255000元共同作用的结果。
从相对数来看报告期的销售额比基期上升了107.43%时由于价格的上升使销售额上升了20%和销售量的增加使销售额上升了72.86%共同作用的结果。
∑x
5. (1)I
f
f 1
=
∑∑
1
f 1f 0
∑
x 0f 0
=146. 07%
∑x
f 1
∑
f 1
-
∑x
f 0
∑
f 0
=205000 0
∑x
(2)I x =
f 1
∑∑
f 1f 1
∑
x 0f 1
=121. 85%
∑x
1
f 1
∑
f 1
-
∑x
f 1
∑
f 1
=1420000
(3)I xf =I x I f =146. 07%⨯121. 85%=177. 99%
∑x ∑x
f 1
∑
1
f 1
-
∑x ∑x
f 0
∑
f 0
+
∑x
1
f 1
∑
f 1
-
∑x
f 1
∑
f 1
=
f 1
∑
f 1
-
f 0
∑
f 0
=3470000
第十一章 统计综合评价
一、选择题
1.B 2.A 3.D 4.A 5.C 6.A
二、思考题(略) 三、计算题
1.计算结果见表,分析略。
2. 计算结果见表,分析略。