第八章整群抽样
第八章 整群抽样
一、基本定义
1.整群抽样:总体——————→若干个群 2.分类:①等容量的群 ②不等容量的群
3.使用前提:总体的基本单元能够组合成“群”。
①群是自然形成的 ②群是人为的进行划分
4.分群原则:群间方差尽可能小,而使群内方差尽可能大。
即:不同的群之间的差异尽可能小,群内单元之间的差异尽可能大。
22
5.总体方差可以分解成群间方差和群内方差,即2between within
2
二、等群的整群抽样
2.抽样方式:总体—————→n个群
3.①总体按群均值的估计:
1n
yiM 无偏 ni1
②总体按小单元均值的估计:
MnM
i1j1yij/nM 无偏 ③V()、V()M2V(),V()④s不是S的无偏估计
22
⑤sb是Sb的无偏估计
22⑥sw是Sw的无偏估计
1f21f2
S的一个无偏估计为v()sb nnM
22
YˆNN YNM 4.
ˆYNMNM5.群内相关系数:c
E(Yij)(Yik)E(Yij)
2
书中式(8.11)与(8.12)
6.设计效应:deff
1f2V()
S ,其中Vran()nMVran()
7.整群抽样效率分析:群内相关系数c越小,即群内方差越大,则估计量精度越高。
三、总体比例的估计
1.使用特点:无论群大小是否相等,均可采用随机抽样方式抽样。 2.估计量形式:3.群大小相等
①相应符号
群大小相等 简单估计
比估计 群大小不等
ˆp②总体相应比例P的估计:P
npi
ni1nM
n
i1
ai, 无偏
③V(p)的估计:v(p), 无偏 式8.23与式8.24 ④设计效应:deff
V(p)
, 式8.25与式8.26
Vsrs(p)
4.群大小不等
①相应符号:mi样本中第i群的大小
ˆp ②总体相应比例P的估计:P
ni1
ai
ni1
mi
, 渐近无偏
③V(p)的估计:v(p), 式8.29、式8.30与式8.31
四、不等群的整群抽样
1.相应符号:每个群的单元格数,即大小为Mi
2.采取简单随机抽样方法
①简单估计:
ˆ(1) 总体总量Y的估计:Y
N
n
n
i1
yiN, 无偏
(2) 平均群和的估计:无偏
ˆ),其无偏估计v(Yˆ), 式8.34与式8.35 (3) 总体总量Y的估计量的方差:V(Y
(4) 总体均值的估计: ,无偏, 式8.37 ②比估计:
ˆ,渐近无偏,式8.39 (1) 总体总量Y的估计:YR
ˆ), 式8.41,其估计v(Yˆ),式8.43 (2) 总体总量Y的估计量的方差:V(YRR
(3) 总体均值的估计:R ,渐进无偏, 式8.38
(4) 总体均值的估计量的方差:V(R), 式8.40,其估计v(R),式8.42
③因为i的差异比较小,所以一般比估计方法比简单估计的方差小,精度更高。 3.不等概率抽样方法 ①放回PPS抽样:Zi
Mi
,i1,2,...,N M0
ˆ ,无偏,式8.44 (1) 总体总量Y的估计:YHH
ˆ), 式8.46,其估计v(Yˆ),式8.48 (2) 总体总量Y的估计量的方差:V(YHHHH
(3) 总体均值的估计:HH ,无偏, 式8.45
(4) 总体均值的估计量的方差:V(HH), 式8.47,其估计v(HH),式8.49 ②不放回πPS抽样:
ˆ, 无偏, 式8.50 (1) 总体总量Y的估计:YHT
4. 前述内容介绍了在群大小不等的情形下
①两种抽样方法
(1)简单随机抽样——简单估计、比估计 (2)PPS抽样——汉森-赫维茨估计
②和三种估计:
(1)如果总体或群内总量与群的规模关系不大,则可采用简单随机抽样,且使用简单估计
(2)反之,则应采用比估计或直接采用PPS抽样 (3)就一般情况而言,后者应用较多。
③两种抽样和三种估计的好坏没有定论,取决于实际的问题 5.在比估计和PPS抽样估计中:
①比估计对群的大小更为敏感,其加权权重比PPS估计更严格
②比估计使用的是不放回抽样,具有修正因子,而PPS抽样则是有放回的,没有修正。因此,如果抽样比较大,建议采用比估计
③比估计是有偏的,但要求样本量(这里是群的样本量)较大,而PPS估计是无偏的,且各单元具有自加权的作用,处理方便。
④就一般情况而言,整群抽样中,PPS抽样应用的更多。