整群抽样采用比率估计量时群对误差的影响
《 统计研究》
年第
期总第
期
群整 样抽采 用 率比估计量 时群
对误
差 的 影 响
—最 读近 了 统计《 研究 》 《称初 探》
,
兼
与李 金 昌同 商 榷
志倪 勋加
年
第,
期
李金 昌 同志 的《分 层 群 整 样 抽探初 》 文
。一
以
简下
觉 得 这 间个 题 是 得 研 究 的
,
值
正如 该 文一 开始 提到
,,
整
群抽样是 一种 简 便 易由 于 群 的 大小一 个
群内 各 位单。
行
、
实用 便方 的样抽组 织 形
式
,然而
在 实际 的应 用过 程中
,由
社 会于 济经现 象 的 或群类是 事
前形 ,的成 等不,
不
主能观 加 地 以控
制,
因 此
存 在两 个问使 其题应 用 到受限 制
使估
计 及方 差量 计 的相对 比 算复较 杂
而影且响到误 差 大 的小,
。
标 志值 间 往 之 比往较 一 致
而 与群群 间之的 差 异 比较 大
从 而,使 群 整抽 样的效 不率高
。另
一方面
,
分 层
抽 样则是 利 用 已 知息 信提高 样抽效率 的 种 一 要重 段
手,
此因试 图把整 抽样 群和 分
层 样抽 结合起 来
相互 充
补以
到 较好 的效得果
,
。
这一 设
想 无 疑是 确 的
正
、
,但
是 章 文 的中
有
。
些观点 结和论 值 得 一进 步 讨
探石 卜
。
、占
有些 算 和 比计较 似 乎 也 欠
夕 迈妥 卜
、、
特 出提 来商 榷,
一
、
属
司、
,
占、、
、
司、‘写
、,。
占
、、
产
石卜巧卜叼
、
阅、
,
、翻
、
、泛
叼 补
夕
、
、石 占卜 夕
、
‘
、、
、、
、
、
、、
司
、
、
、
心宁
卜、占 、占、
过卜 ‘
心,分‘
、述
、
、卜
心宁
表示
一
即,
,
。
在
不放 回
简介
一
尺
,
,。
一尺
,
单随 机 抽样 条 件
下作
。为
以 夕
。
户一
,
户,
。
二、
。
一
。,
的估
计 量、
,
该则估计 是无量偏 的
,
,
,
介、
一
它
的 方 差 以及方差 的 无 偏估 量计依 次 为
「履
〔斋争一 户
,
。。
〕
夕
一
户一争
。
夕
。
一
,。
。
争
,
,。
「
抢豁
民
,
户
,。,
,
一
二表示
,即
第类 与第类 总 体单 位 数 比 以之,
。 。
。
。〕
可即 得到 式
在不
放 回,
将
式。
和
式代
入式
简
单随 抽样条 件机下 ,
户作为,
,
以左
,
。
,加
户、
的
估 计量
,,
该
估计 量具 有 比率
估,
式
可 。以 近 似地由 下式 估计 一
计
的量 性
差近质 似地是
介
当 ,大。 时
,介近 似 无偏
,
其
方几
卫二生 二争
菠,
一
。
。急介
,
一”
左
。,
凡舀邮
政 编
码民
学户 计院
一
一
尝
。
·,
作
者 工 作位单
, 、
。西财经
山笋
对式
统系
,
,
可 作说
明 下如
当
。
较时大
责
任 编
石庆挥友
一
一
一
、
关于影 响不 群整等群 样 抽差方 大 小的 因 素 题问
,。
事
实 对 于上不 等 抽样群 方的式 以
及,
估 计 的量选 是择 多有 方种法 素也的 有 所 同
。
不根
据总 体 不的 同特 点
,
如 群 规模大的小 与的 标志值 群总量 根
因而 影响 计估量 方 的 差
,因·
关 是还与 体总的 值 相均关 可以选 择 不同 的方 法 以达 到较 好 结的果但
,
“初探
”
一
中文主要 论 讨的 在 是等概 率抽 选 群的 条件 下
,
采
用比 率 计估量
来 估总计 体均 值
以
群 大的小作 以 辅 助变 量艺
艺
二‘即
其样 标 抽误准
为
,
二
篇 蒜”酥 一愈了
,
,
《初’ 》中探认 为决 定。幻 小 大 的 影响 素 因三 有 面方 小 越
,数系‘
样
本 群 多的
,
少
越 ,则。 幻
。大
总
体平 群均单 位数 卫 大小的
夕
的异差 情况
,
‘
’ 离差 平方 , 一 前幻的 卫越大 , 幻 小 越 各 群,的 小大 越接 近 则 系各 数 的差 异越小, 幻小 越 我认 为这
,三
,
个 因 素中 一 个 第 素因 是显明的
例 一 样。
正如 简 单 机随抽 样 中样 本 均值 方的 与差 本 量样 大的小 成 反比
‘忍 幻
一
。,
里这 遗 漏 一 个 重 了要因 素 群 是间的差 异 大 小,
而对 于第 二 和 第三两个 因素
则不 ‘ 苟 敢同的 大是小
响受失
。
虽然 从 式
‘的形式上 看 忍越大 会使当
卫增 大时
,
变小
幻,
殊
不知 卫
是,
的一个 值均。
,
它
制 约
,的
,
刃
也 相 应 增地大 ‘
,
‘
因 并不此对
二…二 ,
幻 的
大小起 直接的影
关
于 第三点
,
文章 归结为 数系
在阿 群各的 差 大 异 成 小了决定 抽样 标 误准
即
二二时
卫
,幻
大小的
一
个因 素,
它指 出
当
群各的 单 数位 等
相
一这 因素 的影 响消
样抽标 准 误 公的 式 化简
为忍
,
二
一’一
乙
厂
忍
’,
即
群 的 小大 相 的 等抽 样 标误 公 准式
结论是 各群 的 小 越 接 大近。
,
该则系 的 差 数 异 越
小,
,
。
幻
越小
。
我
为认这一 结 论也 是 有问题
的‘ 一 牙
,幻
如
果我 们 要 估计的 是 总体 均值 的 话卫
一 这 数 只 系 对 是各 群的群 间 方差
也 能可使 ,,
影响
抽 标 准样
误忍 ‘一
关键的是 间 的群 方差 数
。
而,
‘
幻
的 一 权
个这
一 加 权 的 果结可 能使
,
,幻
增
幻 减小大
。
因而
。
‘
之
间 差 程 异度大 就 一不,
定
口使幻 增
二大明
,
、
了为 说明 这一 观 点,
下面也 将用 一例个 子 说来
明
《初。 探》 一文 为中 了说 群 明 的 大小差 异对 样 标抽
准 的 影误响
以 提高可抽 样效率
采
了 用 个 一例实 来
证 通 按过群 的 模 规 大 夹小 层分
。 ““
但 计 算和在 比 较 的方 法上 存 在 一些
问
。
题
知
初拥
探
,
, ”
寺南 胁 。 南 门班 教亡林 什 口二一文 中的层 群 间内方 差 估 计 量写 一成 ”” “一 ” ” 一一
‘
’
’”
’
’
‘
”
’
一
李止艺
’
,
、、
八 、一
。
答
“、
主‘
】
,
、
毛 ,
,一
,
’
子一气
、
,
二
、
,,
‘
‘ 。
严格地 ”
’
‘
‘
“
、 、,
。
应 该说 是
‘方差
是
‘
李淤又 成 忍矿‘
专二于
目
一
,
,
肖
“
、
,
。、
、
,
’,
,一’
’
因 为 按照 抽样 理
二
,
论
,
,
、,
、,
, 第 堪比率 估计量 的 总体 群 间
,一
,
一
万
,、
,
,
‘一
’ ‘,
,
’
’
‘
‘初按 探 中 的》 符号 表“ 示第 ‘的 体总 数群,
层其
估计
量 应 是该曰
‘’
一一
生一
一
一
伪’一
,
‘
丝 、俨 黑火 卫
‘
‘
’
,一一
‘’
,
’
虽然 这里 只是“ 土
乃‘、
‘‘
和,‘
’‘
一
之差‘
,
’
‘在
‘
’,“
协
”
大很的情 况 “下 明 八曰 夕
‘’
。
‘ 为便了于 讨 论 沿 故
的用 基单本 位
数
,探
初
”
文 一的中 符
号‘
,
其 表 中示总体 群
,数
,
示 样 本表 的 群数
。,
‘
表
示 诬 第 中 包 括群
丽个决 示群的 平 均小大
,
示表第 群的 标志值 总量
牙
表 示 第 的 单群位 均值
‘
一
一
出
入并不 大很
。
但我 强们调 其差 的 原 别 有因以 几下点
。
第一,
,
‘
在分层 的整 群抽 样中 一般
是
不的大和除 以
,
因
此影响 就 比 较大
,,
特 别 是 所在举 的 例实 中。
有 个 层二
的‘
二
,
因
此一 个 数 除 以
,见式
的
结果 差别就 显 著 了 第二 原个 因是 在前面 未分 的 层方 差估 计 公式中 己 用 了 一 ‘而分 时层则用 样 前后 不这 一致显然会 大夸计 算的 果结 最 后文中 明 确说
,,
,
明 是方差 的 估 计
量,
因此 这里 的 不减 省略
宜
。
下
面 用 《初就 》探一 文中 的 例 实数据 来 加以 重新 计算和 比
。较
有
数关 见 据《初 探》
。在未分 层采用 比 率 估 计 方法 计估 每 农个 场 平 均的养 牛 数 时头可 以 从 初《探 表》
中
直
!接,
求
得,
即
牙
艺
艺
‘,
‘
头
。
至 直于 抽其 样标 准误 《探 》 给 出接为
,初 ,
,
二幻
但未
给 计算出 过程
根 据前
给面 出 式 ,的
,
里 涉及这 公 式到中 的刃 是 采用 总 体 的 平 均 群的 小大
,
刃
二,
还样是本 群 的 均 大小平
刃
。
,在
样抽理 论 中 对 计算 这一 方 差 估 量计 采用 万 还是刃 无
,尚
论定艺
劣
由 ‘ 于《 探 》中初 给 未总 体出 的农数场目
,
所 以
万 未
知,
,
只 能 用
万 代 替,
,
这 里
二
,夕
旦旦 旦
二。
抽
样标准 的计误算 过 程和结 果 如下
,
一
吞二万丫
厨一
。
‘
‘气 少
丽
艺 ‘
‘一
‘一牙至
一了
丫 /
,/
一
一 一一一
一‘忍
卫
艺
刃
‘ 至
‘
,艺早
至荟
‘
李
艺一
卫! 。丽
一
:
。
二
:
、
l53(14 ) (3)1/ 9
3二丁 二, e7 s we 产芯t
而
. 丈 (45
后 12
4
。3
)
!∀! ∃# %& 旦 &∃公
“
l
乙
。
艺1
1 2 )
v
.
: 不 是 0而 964 后2 来发 现 该例子 数 据 的 借 是用联 合 国 抽样 手 中册 一的个 例子 该 例 给 刃出 .二 .9 代替 45 9 3 90 如 果用 3 就 得 其 到果 为结 a( 幻 “ 0 92 6 4 估 《初计探 接》应用 直
,
53 L 4 )1
、
. 二 丁了 元丽二 0 8 01
,
·
·
,
,
2
1
90
3
了4这 个 结 果 而 没 加有以 说
明
。是 但《 初 探》对中 后 分 面层整 群抽样的方 差 估 计 都量 了用 各层,
样
本 群的平 均 大小 刃 表
1,
,
‘
此因为了 可 比
前 后 计 算的方 法应 该一 致
,
,在
不 层 分时也应 用 本样
群。 的均平 大 小 刃为宜
. 46
,
8
外 在此计 算 分 层
整r r; 一 1 .各 层差方 时 初探{ 中 按 计算 结 果} 改 按 计算 结 果
7
2
} :‘
‘ ( s
。 7 727
二{
『;
‘ ;
.
2,
一群
样抽 方差 估的计 量时 前面 已 经提 应 到将r ‘ 为 r ‘一 l改因此 各 层方 差 计 算的 结 也果 有 了 化 变见表 ()
,l
。
,
(
卜 丫
s 声
: 、
‘/L
从而 按 群的 规 模分层 的 后抽 标样 误准 为
一 )
结二
头 「 ( oJv5
〔 。6 匕3
‘
一
2
23一3 6)江 里宜了+ 里
b
, 5 1( 一4 )5丝
4
+;5 (15 一4) 生了
一 4里
)
」
兴丫
¹
.
. 52 + 285 + 1:6,
4万丽压 二 丫卜
一
石 .。 :236
见 参克伦著科
,
辉吴等 译
; 《 样抽 技术
》
,第
2 页27
,
中
国 统出计 版版
。
社
一3 5一
. 与
分 未层 的抽 样时 标准 误比 较下 降 了 8 5 %
’,
因
此 并 不象《 初 》探中的结 论 减少了 3 以 0
,肠
上
况 ,
。
并且需 要 指出
,
虽然 这 里 计算的结 果按 群的 模 大规 分小 层后 抽 样 标 准 误也 是下降 了
。
但
这
一结 并诊不带 有 遍 普 意
义、。
下面 我 将 们把 原 来 的 据数略 加 修 改
,
,
就 得会到 一 个 相反 的 情
。
其 抽 标样误准不 是 下而是降 增大 三了一 个 证 反实 例的我们 将 《 初探》 l 中 样本群 的规模 保持 变 而不把 养 牛 的 头数表 2 再根 据 2表的数 据资 料
仍 按来 的原规 模 进 行 层分 如表 3加略 改修如
,表
也
就是说 按 的规层 模小 分大层以
后,
。
表
2
4
修 后改1 个 样 本 的群有 资料关农
数场, M 养牛 总 数
x
=一
3
表
修4改 后 1 个 木 数样据 农场 多 按分层少资 料
x 工‘,
I
农_样本 群 ! 场 , M ‘ 原I编
号 巧 8 5 24 0 1790 21
8 3 1 461 5 4 200 3 8 12 3
92 1 74 63U 50 4 1
3 5 “ 674 巧0 8 1 3 2 38
弱 朽 6
7 写“ 3 2好4 8 3 1
矛 002 48 0 0 82 6 3 15 93
U
n
纠
牛养 平均 ‘. 头x
数 Jj‘ 月心 U 二土一, 曰 ‘n 乃 土凡 内 了9
嘴J 上, 一一比 洲叭 一翻 特 r卜习 月卜千川 6
‘.
4
4
.
石 7 [ 一二 一创 一之7一 内4 :2 钊 乐 0比了: , 熟 子门匀场 j 口 讨
。 rJ月 -。 才 几 ,、 .目
.
. l ‘..百 J 训 进 引 ,‘ ‘.J. j月‘ 卜 . . ,.,卫 .‘ J几1 孟石 ‘ 工 曰ar 卫 ,上弓 lle L,一 1w一 乙山 启Ue
几 s e .e r J
. 1一 认| r白3 东一 么 康a左 石 … 勺
!, ls e
JJ山 J‘ ,, 匡 一刁矛 自JO伪
一
r
工
4
‘」 全目6 八 l
Un J, j目 一岛一 X 44 R
刁 ,、 d土 一 古曰R上一 ,二
Z
,人上
J
9
721
2,
J07 “ 8
3
0双 18
合 计l 一
! 363
根据上 数述
据 不在分 层 比的率 估 计 条 件下其 抽 样标 误准 r ~为‘ ‘ “x 2 一 M恋‘ 〕) R/一 〔 ( M )王二 叭 二夕 V 反 “ 石 万乙 刀釜,
:
R
r一r rl一R (
)艺
M(
‘,
一2 )
一
2 艺至
Mx‘
+
荟牙
艺
M釜
卫
资. .
“ 了 0674 5二0 6 5 37重
,
丝
续1 (4 .1了 3鱿又)~3华 )丝 l 全 红卫些叨卿)红赵 些 些迎 丝 丝 兰5 4 5又 1
2 。乙
.
~
而
按群的 大 小 分 层 后 的抽 样标准 误 用下 列式 计 算公
W
‘
即S
二 ‘/
R (
’
,以
所 (
’『
”一“a
1W
,
‘
,
一
其“中
:
口
卜
.
8)2(53978 ) + 22 (82 )2(4 3 49 ). . 二 22 972 5 ( 6 2 5 .). 2 502 605 一 2( 2 25 6 )( 11 52 6 )3+ ( 1 25 )6 (2 92 33 ) . 二0 3147 (75 )2
47 2 69一 20( 12
洽
黔于)(
.
’
(
,
‘,
一,
‘
,箭
竿2艺(
M‘
,
吐
T.
2)
‘
为因
二 才W
艺‘
‘, 云
其
W
中 ‘
‘
) 为各 的层 权
一
.s :
斋 5 : 一( 吐. T
‘
‘几
恋。
,一2
(
‘
r 牙‘
M 艺圣 一 l) 釜
,
至. 刃,
+
牙
, 专M艺 圣
。
4
2
一
4 一
5,
_ 2
1 2 75 9
3
U
互
一.
. 2 一 2( 1 0 2 ) (5 2 0 7 96 1)+ ( 102 5) ( 02 421 ) 一 了_U了5 )吸
·。
,
。r o
_乙
‘
3
代 公式入
得
(
『2
a:
(二
)
二
丽而 二 。了 6丁
。
文 结论的 相矛 盾响
,
再
用 群 的大小 分来 层是没 有 意 义
,的
志
进 行 分 对层 提于 抽高样效 率 有 是帮 助
的较
的 强相 关率
、
。 由 此可 知初《探 一 》文中主 张交 的分叉 层方 法是也没 有
必 要 的四为 进一步了 说 明M‘ 这一 系 的 数变动 缩小并 不 定一 使 抽会样 标准 误 减 少 我 们 还 的2 例子 设假 们它 各 群 的规模 相 等 每个即 群 4 或为 个 农 场 4 而群各 每个 可 紧 接 以 表 中56 4 :)农 场的 平 均 养牛 数 不头 变是 子下 有列数据 ( 见 表
表4
、群
843 14 91份 2 70 162
,
‘,
—一
二
(,4 5 . 5, 5+头 勺3
‘
’
2
26 3 +赤! 卜‘ ,掣 ‘
.24 。38+
, 5
,(.
,‘
卫 ‘ 丝 5‘ ,卜 位 十尹 (卜, 罕{
1
3
1.8 5 ) 二。 2 2 :
3
.
489 ,
9反
而 比 不分 层 时 的 抽样 标准误 增加 了 2 肠
,
4
。
我为认 采用当 比率 计 估量 估来 总 计体 均值时
,这
就 和 《 初 探》一实 际 上 已 消 除 了 的 群大小影
,
当然 估在计总 均 体值
时,
按
照总 体均 值 或相其关 标,
因
此如 果 群 规 模 的大与 小估计 均值大 小 之 间 存在
那么 按 群 的 大小 来分层 实 质 上 也 是 按均 值的 就大小来 分 层。
这时 才能 提 高效,
阿
,
,
,
,41 个相 等群 的 养 头 数
农牛场 M
、数 6朽 5 书4朽 54
‘}
可 以
用采群 的大小 相 的同整 群 样 抽误差
每公农 场均平牛养、
8 491 8718 52 0 巧 10 U2
{
式
:
(
·
·一,
丫
舒与蒜
、
。一
,
2
/l
3
9 丁卜侧二 , ,一
屯
v
3
6 14又)
叹 14-
日。 1U1 )
二. 了改 百 “ 0范8 5 万
其 结 果也 于大 的 群 大小 不 等 时 相 抽的样 标 准 .误 0 8 673。
上 综所 《述初探 一 文) 中 的 论结 应作 一
些修 正 ;在采 月比率 估计 量
,
时分
层 抽样
按
群的规 模 小 大分层无 甚 必 要 据
体特 总点的具 体 况情 而
定
,如
分 何 层要根 本文 作不 详
细。
展开
。
( 者作工作 单 位
中: 人 国 民大学统 学计 系
邮政,编 码 :1 00 728 :)(责 编任 样许 亦 频 )
一
5 一5