统计学 第五章 抽样推断课后答案
第五章 抽样推断
一、单项选择题
二、多项选择题
三、判断题
四、填空题 1、变量 属性 2、正 反
3、重复抽样 不重复抽样 4、抽样总体 样本 5、大于 6、标准差
7、样本 总体 抽样平均误差 抽样平均误差 △x = Z σx 8、合适的样本估计量 一定的概率保证程度 允许的极限误差范围 9、随机抽样 统计分组 10、增大 增大 降低 11、大数定律 中心极限定理 12、样本容量不小(不小于30个单位) 13、大 0.5
-
n n N N
14、缩小
(即0.5774) 扩大 1.1180 3
15、估计量(或统计量) 参数 五、简答题(略) 六、计算题
1、已知条件:P = 0.5 ,n = 100 且重复抽样 求:p ≤0.45的概率 解:
Z =
p -P P (1-P ) n
=
0. 45-0. 50. 5⨯(1-0. 5)
100
=1
则F (Z = 1) = 0.6827 所以p ≤0.45的概率为:
1-0. 6827
= 0.15865 2
2、解
E (x 1) = E (0.5X 1 + 0.3X 2 + 0.2X 3) = 0.5 E (X ) + 0.3 E (X ) + 0.2E (X ) = E (X ) = X
E (x 2) = E (0.5X 1 + 0.25X 2 + 0.25X 3)
= 0.5 E (X ) + 0.25 E (X ) + 0.25E (X )
= E (X ) = X
E (x 3) = E (0.4X 1 + 0.3X 2 + 0.3X 3) = 0.4 E (X ) + 0.3 E (X ) + 0.3E (X ) = E (X ) = X 所以x 1、x 2、x 3都是X 的无偏估计量。 D (x 1) = D (0.5X 1 + 0.3X 2 + 0.2X 3) = 0.25 D (X ) + 0.09 D (X ) + 0.04D (X ) = 0.38
D (x 2) = D (0.5X 1 + 0.25X 2 + 0.25X 3)
= 0.25 D (X ) + 0.0625D (X ) + 0.0625D (X )
= 0.375
D (x 3) = D (0.4X 1 + 0.3X 2 + 0.3X 3) = 0.16D (X ) + 0.09D (X ) + 0.09D (X ) = 0.34
由于0.38>0.375>0.34 ,所以x 3最有效。 3、已知条件:P = 0.1 ,n = 500 求:p ≥ 0.12的概率 解:
Z =
p -P P (1-P ) n
=
0. 12-0. 10. 1⨯(1-0. 1)
500
=1.49
则查表得F (Z = 1.49) = 0.8638 所以p ≥ 0.12的概率为:
1-0. 8638
= 0.0681 2
4、已知条件: X = 68公斤,σ= 12公斤,则
Z =
x -X
n
72-68==2.36
12
50
查表得F (Z = 2.36) = 0.9817 所以,x >72公斤的概率为:
1-0. 9817
= 0.0091 2
在计算概率时,假设了旅客的体重呈正态分布。如果旅客体重不呈正态分布,则超重的概率就可能增大;此外,根据本例的计算结果,旅客不能有任何随身携带的行李,否则超重的概率也将大大增加。
5、在重复抽样条件下,抽样单位数n 若增加了3倍,即为4n ,则新的抽样平均误差σx ’为原抽样平均误差σx 的二分之一,即
σx ’=
σx
4n
=
11σx
= σx
2n 2
如果抽样单位数n 减少了50%,即为0.5n ,则新的抽样平均误差σx ’为原抽样平均误
差σx 的1.414倍,即
σx ’=
σx
0. 5n
= 1.414
σx
n
= 1.414σx
6、设该种袋装花生的平均粒数为x ,标准差为σ。
已知:F (Z ) = 1- 2×0.0668 = 0.8664,所以袋装花生130粒的临界值Z = 1.5 又:F (Z ) = 1- 2×0.1586 = 0.6828,所以袋装花生100粒的临界值Z = 1.0 根据
Z =
有
1.5σ= 130 -x 1.0σ= x - 100
解得
x -x
σ
x = 112(粒)
σ= 12(粒)
7、已知条件:σ= 3克 ,n = 36袋 ,要求x ≥ 250克的概率达95% ,临界值Z 为1.645 。 求:X 根据
Z =
x -X
n
有
1.645 =
250-X 336
=
X -250
12
X = 250.82(克)
应将机器调节至平均装250.82克的位置上。
8、已知条件:n = 144 、x = 4.95 m 3 、σZ = 2(而且条件为重复抽样)
x
2
= 2.25 、F (Z )= 95.45%时,
σx =
2σx
n
=
2. 25
= 0.125 m3 144
△x = Z σx = 2×0.125 = 0.275 m3
x - △x ≤X ≤x + △x
4.95 – 0.25 ≤X ≤4.95 + 0.25 4.7(m 3)≤X ≤5.2(m 3)
10000名工人的平均工作量,将落在4.7(m 3)至5.2(m 3)范围内的可靠程度可达95.45% 。 9、抽样平均误差计算表:(条件为不重复抽样)
设x 0 = 650,d = 100 ①工人收入的标准差:
x -x 02x -x 0⎡() f (∑⎢∑) f
σx =d -⎢
f f ⎢
⎢⎣⎤
⎥⎥ ⎥⎥⎦
2
380⎡40⎤
= 100-⎥ 250⎢250⎣⎦
= 122.2457(元)
工人收入的抽样平均误差:
2
σx =
2σx
n
(1-
14944n
(1-5%) = 7.5357(元) ) =
250N
女工比重的抽样平均误差:(女工比重 p = 20%)
σp =
②工人的平均收入
p (1-p ) n 0. 2⨯0. 8
(1-) =(1-5%)= 0.0247 n N 250
x =
∑(
x -x 0
) f ⋅d +x 0 f =
40
⨯100 + 650 = 666(元) 250
当F (Z )= 95.45%时,Z = 2 所以
△x = Z σx = 2×7.5357 = 15.0714 (元)
则5000名工人的平均收入范围为:
x - △x ≤X ≤x + △x
666 – 15.0714 ≤X ≤666 + 15.0714 650.9286(元)≤X ≤681.0714(元)
而5000名工人的总收入范围为:
650.9286×5000 ~ 681.0714×5000 3254643(元)~ 3405357(元)
当F (Z )= 86.64%时,Z = 1.5 所以
△p = Z σp = 1.5×0.0247 = 0.03705
则女工比重的范围为:
p – △p ≤P ≤p + △p 20% - 3.705% ≤P ≤20% + 3.705%
16.295% ≤P ≤23.705%
③关于平均收入的样本容量
根据要求:△x = 666×2% = 13.32(元),F (Z )= 95%时,Z = 1.96
2
NZ 2σx
n = 222
N ∆+Z σx x
5000⨯1. 962⨯14944
= 22
5000⨯13. 32+1. 96⨯14944
= 303.9 = 304(人) 关于女工成数的样本容量
根据要求:△p = 3.5% ,F (Z )= 95%时,Z = 1.96
NZ 2p (1-p )
n = 22
N ∆p +Z p (1-p )
5000⨯1. 962⨯0. 2⨯0. 8
= 22
5000⨯0. 035+1. 96⨯0. 2⨯0. 8
= 456(人)
以后调查同一总体时,应该确定的样本容量应为456人。 10、条件:n = 500件 、抽样)
n
= 5% 则N = 10000件,p = 95%,△p = 2%(条件为不重复N
0. 95⨯0. 05
(1-5%)= 0.0095
500
σp =
p (1-p ) n
(1-) = n N
p – △p ≤P ≤p + △p 95% - 2% ≤P ≤95% + 2%
93 % ≤P ≤97 %
根据△p = Z σp 得
Z =
∆p
σp
=
0. 02
= 2.11
0. 0095
Z = 2.11查表得F (Z )为96.52%,即一级品率落在93 %至97 %范围内的可靠程度可达到96.52% 。
另外,在此范围内的一级品数量是9300件至9700件。 11、已知条件:n = 400台,不重复抽样但
n
为很小部分。 N
①使用时间10年以下车床台数的比重区间,p = 25% ,Z = 2
σp =
p (1-p ) 0. 25⨯0. 75
= = 0.0217 n 400
△p = Z σp = 2×0.0217 = 4.34% p – △p ≤P ≤p + △p
25% - 4.34% ≤P ≤25% + 4.34%
20.66% ≤P ≤29.34%
②使用时间10-20年的车床台数的比重区间,p = 48% ,Z = 2
σp =
0. 48⨯0. 52p (1-p )
= = 0.0250
400n
△p = Z σp = 2×0.0250 = 5.00%
p – △p ≤P ≤p + △p 48% - 5% ≤P ≤48% + 5%
43% ≤P ≤53%
③使用时间20年以上车床台数的比重区间,p = 27% ,Z = 2
σp =
p (1-p ) 0. 27⨯0. 73
= = 0.0222 n 400
△p = Z σp = 2×0.0217 = 4.44%
p – △p ≤P ≤p + △p
27% - 4.44% ≤P ≤27% + 4.44%
22.56% ≤P ≤31.44%
12、根据Z =
x -X
σ可得
F (Z )= F (
x -X
σx
)
= F (
46-4252-46)+ F () 44
= F (1)+ F(1.5) =
0. 68270. 8664
+
22
= 0.7746
居民家庭平均每月的书报费支出有77.46%的可能在42~52元之间。 13、已知条件:σx = 50克(选择最大的),F (Z )=0.9545则Z = 2, △x = 10克
2
22⨯502Z 2σx == 100(平方公尺) n =22
10∆x
14、已知条件:σ
2
, p = p (1- p ) = 0.91×0.09 = 0.0819(选择最大的)
F (Z )=0.8664则Z = 1.5,△p = 3% 。
Z 2p (1-p ) 1. 52⨯0. 0819
== 205(包) n =22
0. 03∆p
15、已知条件:N = 1000箱,n = 100箱。 废品率平均数与标准差计算表:
①废品率样本平均数
x =
废品率样本方差
∑xf f
=
200
= 2 (%) 100
σ
废品率抽样平均误差
2x
∑(x -x ) =
f
2
f
=
45
= 0.45 100
σx =
2σx
n
(1-
n 0. 45100) =(1-) = 0.0636(%) N 1001000
废品率抽样极限误差[F (Z )= 0.6827则Z = 1]
△x = Z σ= 0.064(%)
在68.27%的概率保证下,1000箱平均废品率的可能范围
x - △x ≤X ≤x + △x
2 – 0.064 ≤X ≤2 + 0.064 1.936(%) ≤X ≤2.064(%)
②当F (Z )= 0.9545则Z = 2,△x = 0.25(%)时
2
NZ 2σx 1000⨯22⨯0. 45n === 28(箱) 22222
N ∆x +Z σx 1000⨯0. 25+2⨯0. 45
16、已知条件:N = 10000支,p = 91%和88%,σx = 89. 46和91. 51小时。 ①当F (Z )= 0.8664则Z =1.5,△x = 9小时 重复抽样条件下应抽取的元件数:
2
Z 2σx 1. 52⨯91. 512
== 232.6 = 233支 n =22
∆x 9
不重复抽样条件下应抽取的元件数:
2
10000⨯1. 52⨯91. 512NZ 2σx
== 227.3 = 228支 n =222222
N ∆x +Z σx 10000⨯9+1. 5⨯91. 51
②当F (Z )= 0.9973则Z =3,△p = 5% 重复抽样条件下应抽取的元件数:
Z 2p (1-p ) 32⨯0. 88⨯0. 12
== 380.2 = 381支 n =
0. 052∆2p
不重复抽样条件下应抽取的元件数:
NZ 2p (1-p )
n =22
N ∆p +Z p (1-p )
10000⨯32⨯0. 88⨯0. 12
== 366.2 = 367支
10000⨯0. 052+32⨯0. 88⨯0. 12
③在不重复抽样条件下,要同时满足①、②的要求,需抽367支元件。 17、重复抽样条件下,样本数目M 为:
M = N n = 205 = 3200000(个样本)
不重复抽样条件下,考虑顺序的样本数目M 为: M = N (N –1)(N –2)…(N – n + 1)
= 20 ×19 ×18 ×17 ×16 = 1860480(个样本) 不重复抽样条件下,不考虑顺序的样本数目M 为:
M =
18、样本平均数
N ! 20⨯19⨯18⨯17⨯16
== 15504(个样本)
n ! (N -n )! 5⨯4⨯3⨯2⨯1
x =∑
n i x i n
i
2
x
=
680⨯35+420⨯15
= 602(kg )
35+15
样本方差 σ
2x
∑n σ=
n
802⨯35+1202⨯15
== 8800
35+15
抽样平均误差(因50亩在5000亩中占很小比例,用重复抽样公式)
σx =
2σx
n
=
8800
= 13.27(kg ) 50
当概率为0.9545时的极限误差
△x = Z σx = 2×13.27 = 26.54(kg )
该村的粮食平均产量可能范围
x - △x ≤X ≤x + △x
602 – 26.54 ≤X ≤602 + 26.54 575. 46(kg ) ≤X ≤628.54(kg )
该村的粮食总产量可能范围
(x - △x )×N ≤总产量≤(x + △x )×N 575.46 × 5000 ≤总产量≤ 628.54 × 5000 2877300(kg ) ≤总产量≤ 3142700(kg )