抽样调查中样本量的确定
问题研究
抽样调查中样本量的确定
文/徐静远
样本量的确定是抽样设计中的一个重要内容。对于一种确定的抽样方法,样本量愈大,抽样误差就愈小,估计量的精度就愈高。但样本量愈多,相应的费用也愈多。对于一个具体的抽样设计,确定合适的样本量是最优设计的重要问题。
下面讨论在一定精度要求的条件下如何确定样本量。方法1、根据估计量的方差公式确定样本量设估计某个主要总体指标的精度要求为置信度1-α下的绝对误差限为d,根据估计量的方差公式,可以确定样本量。
例如对某高校在校大学生学习生活状况进行调估计某总体均值的精度要求为置信度1-α下估计查。
总体均值的绝对误差限为d,以学生宿舍为群,采用整群抽样。设全校有N个学生宿舍,每个学生宿舍有M个学生,采用简单随机抽样抽取群时,抽取的宿舍数n的确定方法如下:
deff。
例如在某市大学生网络生活方式调查中,采用分PPS抽样、三阶抽样和简单随机抽样多种抽样层抽样、
首先采用分层抽样,把某市的高校进行方法结合使用。
分层。再采用三阶抽样,采用与规模大小成比例的概率随机抽样所需的样本量nsrs。假设精度要求为置信度1-α下的绝对误差限为d。如果无法得到P的初始估(即P=Q=0.5时),只要计值时,由于PQ最大值为0.25P不是太大(P>0.9)或太小(P
21-α/2
d
PQ。修
n0
。可以根据估计出的复杂抽样的设计
01+
效应deff,计算出复杂抽样所需的样本量为:n=nsrs×
22(即PPS抽样)抽取学校;对于抽中的高校,采估计量的方差为1-fSb其中Sb为群间方差。抽样方法
用简单随机抽样抽取班级;在抽中的班级内再采用简
)=μ1-α/2
根据要求有d=μ1-α/2姨=S单随机抽样抽取学生,进行调查。
b
2在这种多种抽样方法结合使用的复杂抽样情况
2μ1-α/2Sbn0
则n0=,n=,其中Sb可以利用以往下,用设计效应得到估计量的方差公式很困难。这时,01+
deff确定样本量非常方便。的资料或试点调查加以估计。样本量的确定方法如下:按简单随机抽样时,在
姨
但进行复杂抽样情况下,得到精确的估计量的方差公式很困难,尤其是多种抽样方法结合使用时。这时,用下面的方法确定样本量非常方便。
方法2、根据设计效应(deff)确定样本量
某个抽样设计的设计效应(简称deff)反映了该抽样设计的效率,它就是将某个抽样设计的估计量的方差与同样样本量条件下的不放回简单随机抽样简单估计量的方差进行比较。如果可以估计出复杂抽样的设计效应deff,就可以利用设计效应(deff)确定样本量,方法比较简单。
在复杂抽样时,利用设计效应deff确定样本量方法如下:首先,在给定估计某个主要的总体指标的精度要求条件下,容易得到简单随机抽样所需的样本量
90%置信度下,绝对误差为10%,取总体比例为50%,则简单随机抽样样本量应为:
n0=μ
21-α/2
PQ=1.645×0.5×0.5=68
d0.1
2
n=n0×deff=68×2=136因此,总样本量取为136。
如果主要总体指标有多个,不论是利用方法1或都需要分别求出满足每个主要总体指标精度要方法2,
求的样本量,再取最大值做为这次调查的样本量。
确定样本量除了通过以上两种定量的方法之外,还要考虑调查表的回收率。调查过程中,可能有些调查对象拒访或因种种原因调查不到,这时样本量应适当放根据估计的回收率反算出应接触的样大。一种做法是,
nsrs。其次,可以根据估计出的复杂抽样的设计效应deff,本量。例如在某市大学生网络生活方式调查中,如果回
计算出复杂抽样所需的样本量为:n=nsrs×deff。
收率估计为90%,则应接触的样本量为:n=136=151。
在估计总体比例时,利用设计效应deff确定样本量就更便捷了。在一定精度要求条件下,容易得到简单
(作者单位:郑州外国语学校)
432009.4