抽样调查-分层抽样实验报告
实 验 报 告
实验思考题:
1、 某调查员欲从某大学所有学生中抽样调查学生平均生活费支出情况,假设该调查员已经
完成了抽样,并获得样本情况(见样本文件),请根据此样本分别按性别、家庭所在地分层,并计算各层的样本量、平均生活费支出、生活费支出的方差及标准差。
(1) 先对数据按照家庭所在地进行排序:【数据】→【排序】,选择“家庭所在地” (2) 再对数据进行分类汇总:【数据】→【分类汇总】,“分类字段”选择“家庭所在地”,
“汇总方式”选择“平均值”,“选定汇总项”选择“平均月生活费”,在对话框下方选择“汇总结果显示在数据下方”;再做两次分类汇总,“汇总方式”分别选择“计数”和“标准偏差”。最后得到表1-1所示结果:
表1-1
家庭所在地 平均月生活费 大型城市 平均值 614.5348837 大型城市 计数 86 大型城市 标准偏差 300.0849173 乡镇地区 平均值 529.4117647 乡镇地区 计数 68 乡镇地区 标准偏差 219.0950339 中小城市 平均值 618.6440678 中小城市 计数 118 中小城市 标准偏差 202.5264159 总计平均值 595.0367647 总计数 272 总计标准偏差 243.4439223
(3) 在SPSS 软件中得出的计算结果:
选择————,然后在出现的对话框中
分别在“Dependent list”框中选入“家庭所在地”,在“Independent
List ”框中选入“平均月生活费”,得到如表1-2所示结果:
表1-2
平均月生活费
Report
选择
——
,在出现的对话框中选择“function ”选择估
图1-1
计量,得到如图1-2所示结果:
图1-2
选择
——
——
,出现如下图所示对话
框,并按照下图1-3中所选项进行操作:
得到如下图表的结果:
Case Processing Summary
Descriptives
Std. Deviation Minimum Maximum Range
Interquartile Range Skewness Kurtosis
乡镇地区
Mean
95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range
Interquartile Range Skewness Kurtosis
中小城市
Mean
95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range
Interquartile Range Skewness Kurtosis
Lower Bound Upper Bound Lower Bound Upper Bound
300.085
100 2500 2400 300.00 3.116 17.407 529.41 476.38 582.44 518.46 500.00 48002.634 219.095
200 1000 800 200.00 .996 .172 618.64 581.72 655.57 612.34 600.00 41016.949 202.526
200 1200 1000 300.00 .686 .168
.260 .514 26.569
.291 .574 18.644
.223 .442
2、 教材129页第3.3题
层
1 2 3
10 20 0 10 35 20 2 10 0 0 50 30
样本 20 10 0 40 30 50
50 40 10 10 0 30 20 30 20 20 0
(1)数据结构、运用Excel 的计算步骤及结果如下:
层
1 2 3
10 20 0 10 35 20
2 10 0
0 50 30
20 0 30
样本
10 40 50
0 50 40
10 10 0
30 20 30
20 20 0
20.0678 9.47212 3.07768 1.0483
0.29614 总样本量 185.907 175.381
比例分配 奈曼分配 56.3888 33.659 92.5129 98.853 37.0051 42.869 185.907 175.38
比例分配 奈曼分配 n1 n2 n3 sum
奈曼分配层权 w1 0.192 w2
0.564 w3 0.244 1
第h 层的层权:W h =
N h
N
1
第h 层的样本均值:h =
n h
2h
n h
∑y
i =1
n h
hi
第h 层的样本方差: s =∑(y hi -h ) 2/(n h -1)
i =1
L
21-f h 2ˆ总体均值方差:V () =V (st ) =∑W h h =9.472 n h h
V (st ) =(
r ⋅210%*20. 06782
) =() =1. 0483 u α/21. 96
下面计算两种分配方法的样本量及每层要抽的样本量:
1. 比例分配:
比例分配的层权为:w h =W h
故:n 1=w 2⨯n =56.3888 取整得n 1=57
n 2=w 2⨯n =92.5129 取整得n 2=93
n 3=w 3⨯n =37.0051 取整得n 3=38
2. 奈曼分配:
L
h
奈曼分配的层权为:w h =W h S h /
∑W S
h =1
h
故:n 1=w 2⨯n =33.659 取整得n 1=34
n 2=w 2⨯n =98.853 取整得n 2=99
n 3=w 3⨯n =42.869 取整得n 3=43
(2)在SPSS 中的计算均值与方差的结果如下:
Descriptives
Variance Std. Deviation Minimum Maximum Range
Interquartile Range Skewness Kurtosis
2
样本
Mean 95% Confidence Interval for Mean
5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range
Interquartile Range Skewness Kurtosis
3
样本
Mean 95% Confidence Interval for Mean
5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range
Interquartile Range Skewness Kurtosis
Lower Bound Upper Bound Lower Bound Upper Bound
94.400 9.716
0 30 30 18.50 .668 -.040 25.00 12.72 37.28 25.00 20.00 294.444 17.159
0 50 50 32.50 .330 -1.001 20.00 6.51 33.49 19.44 25.00 355.556 18.856
0 50 50 32.50 .124 -1.508
.687 1.334 5.426
.687 1.334 5.963
.687 1.334
3、 教材130页第3.4题
Wh
0.18 0.21 0.14 0.09 0.16 0.22
ah
27 28 27 26 28 29
11655.50.4522220.1782
0.50.0003970.25838总体比例估计 总体比例估计方差 总体比例估计标准差 V
比例分配 奈曼分配 n1 n2 n3 n4 n5 n6 SUM 0.924 0.000396981 0.019924378 2.60308E-05
总样本量 2662.655644 2564.651673 比例分配 479.278016 559.1576853 372.7717902 239.639008 426.0249031 585.7842418 2662.655644
奈曼分配 535.9991 519.9509 416.8882 303.6744 396.1531 391.9861 2564.652 比例分配层权 w1 0.18 w2 0.21 w3 0.14 w4 0.09 w5 0.16 w6 0.22
奈曼分配层权 w1 0.208995 w2 0.202737 w3 0.162552 w4 0.118408 w5 0.154467 w6 0.152842 1
公式:
(1) 总体比例P 的简单估计量:
=P , h =P h , st =p h .
按照总体均值估计量的公式,可推出总体比例(成数)P的估计量为:
ˆ=∑W P ˆP st h h =∑W h p h =0.924
h
h
L L
(2) 总体比例P 的方差为
L
p (1-p h ) 12ˆˆ=2V (P st ) =∑W h (1-f h ) h n -1N h h
L h
∑N h (N h -n h )
p h (1-p h )
n h -1
(3) 第h 层的样本方差为:S h =(4) 样本总量:
若N h 较大,则S h ≈P h (1-P h ) , 此时可进一步求出估计P 时对给定的分配形式(n h =nw h ) 有:
2
2
n h
p h q h def p h q h h
n -1
W h P h (1-P h ) ∑w h
n =
1L
V +∑W h P h (1-P h )
N h
2
计算抽样的样本量:
1
在此题中,总体数量N 非常大,故,
N
因此:由公式(4)得:
∑W P (1-p
h
h
h =1
L
h
) ≈0,
(比例分配的层权为:w h =W h )
各层的样本量为:n 1=w 2⨯n =479.278016 取整得n 1=480
n 2=w 2⨯n =559.1576853 取整得n 2=560
n 3=w 3⨯n =372.7717902 取整得n 3=373 n 4=w 4⨯n =239.639008 取整得n 4=240
n 5=w 5⨯n =426.0249031 取整得n 5=427 n 6=w 6⨯n =585.7842418 取整得n 6=586
(奈曼分配的层权为:w h =W h S h /
∑W S
h
h =1
L
h
)
各层的样本量为:n 1=w 2⨯n =535.9991 取整得n 1=536
n 2=w 2⨯n =519.9509 取整得n 2=520
n 3=w 3⨯n =416.8882 取整得n 3=417 n 4=w 4⨯n =303.6744 取整得n 4=304
n 5=w 5⨯n =396.1531 取整得n 5=397 n 6=w 6⨯n =391.9861 取整得n 6=392