分层抽样与系统抽样(教师版)
分层抽样与系统抽样
[读教材·填要点]
1.分层抽样的概念 将总体按其属性特征分成若干类型(有时称作层) ,然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.
2.系统抽样的概念
系统抽样是将总体的个体进行编号,按照简单随机抽样抽取第一个样本,然后按相同的间隔(称为抽样距) 抽取其他样本. 系统抽样又叫等距抽样或机械抽样.
[小问题·大思维]
1.分层抽样时为什么要将总体分成互不重叠的层?
提示:在总体中由于个体之间存在着明显的差异,为了使抽取的样本更合理,更具有代表性,所以将总体分成互不重叠的层,而后独立地抽取一定数量的个体.
N 2.系统抽样的第二步中,当不是整数时,从总体中剔除一些个体采用的方法是什么?n
影响系统抽样的公平性吗?
提示:剔除一些个体可以用简单随机抽样抽取,不影响系统抽样的公平性.
[例1] 某企业共有3 200名职工,其中青、中、老年职工的比例为3∶5∶2. 若从所有职工中抽取一个容量为400的样本,则采用哪种抽样方法更合理?青、中、老年职工应分别抽取多少人?每人被抽到的可能性相同吗?
[自主解答] 因为总体由差异明显的三部分(青、中、老年) 组成,所以采用分层抽样的方法更合理.
因为青、中、老年职工的比例是3∶5∶2,所以应分别抽取:
35青年职工400×120(人) ;中年职工400×=200(人) ; 1010
2老年职工400×80(人) . 10
4001由样本容量为400,总体容量为3 200可知,抽样比是=3 2008
1能性相同,均为. 8
[悟一法]
分层抽样的步骤:
(1)根据已经掌握的信息,将总体分成互不重叠的层;
n (2)根据总体中的个体数N 和样本容量n 计算抽样比 k ; N
(3)确定第i 层应该抽取的个体数目n i =N i ×k (N i 为第i 层所包含的个体数) ,使得各n i 之和为n ;
(4)在各层中,按步骤(3)中确定的数目在各层中随机地抽取个体,合在一起得到容量为n 的样本.
1.某城市有210家百货商店,其中大型商店20家,中型商店40家,小型商店150家.为了掌握各商店的营业情况,计划抽取一个容量为21的样本,按照分层抽样方法抽取时,各种百货商店分别要抽取多少家?写出抽样过程.
211解:第一步:样本容量与总体容量的比为=21010
111目:大型商店:20×2(家) ,中型商店:404(家) ,小型商店:15015(家) ;101010
第三步:采用简单随机抽样在各层中分别抽取大型商店2家,中型商店4家,小型商店15家,综合每层抽样即得样本
.
[例2] 相关部门对某食品厂生产的303盒月饼进行质量检验,需要从中抽取10盒,请用系统抽样法完成对此样本的抽取.
[自主解答] 第一步 将303盒月饼用随机的方式编号.
第二步 从总体中剔除3盒月饼,将剩下的300盒月饼重新编号(分别为000,001,…,299) ,并分成10段.
第三步 在第一段中用简单随机抽样抽取起始号码l .
第四步 将编号为l ,l +30,l +2×30,…,l +9×30的个体取出,组成样本.
[悟一法]
N 1.当总体容量能被样本容量整除时,分段间隔k ;当用系统抽样抽取样本时,通常n
是将起始数s 加上间隔k 得到第2个个体编号(s +k ) ,再加k 得到第3个个体编号(s +2k ) ,依次进行下去,直到获得整个样本.
2.当总体容量不能被样本容量整除时,可以先从总体中随机剔除几个个体,但要注意的是剔除过程必须是随机的,也就是总体中的每个个体被剔除的机会均等,剔除几个个体后使总体中剩余的个体能被样本容量整除,然后再按系统抽样方法抽取样本.
2.为了了解某地区今年高一学生期末考试数学学科的成绩,拟从参加考试的15 000名学生的数学成绩中抽取容量为150的样本.请用系统抽样写出抽取过程.
解析:(1)对全体学生的数学成绩进行编号:1,2,3,…,15 000.
(2)分段:由于样本容量与总体容量的比是1∶100,所以我们将总体平均分为150个部分,其中每一部分包含100个个体.
(3)在第一部分即1号到100号用简单随机抽样抽取一个号码,比如是56.
(4)以56作为起始数,然后依次抽取156,256, 356,…,14 956,这样就得到容量为150的一个样本
.
[例3] 选择恰当的抽样方法,并写出抽样过程.
(1)有30个篮球,其中,甲厂生产的有21个,乙厂生产的有9个,现抽取10个作样品;
(2)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,现取出3个作样品;
(3)有甲厂生产的300个篮球,抽取10个作样品;
(4)有甲厂生产的300个篮球,从中抽取30个作样品.
[自主解答] (1)因总体是由差异明显的几部分构成,可采用分层抽样的方法抽取.
1011第一步 确定抽取个数.因为=,所以甲厂生产的应抽取21×7(个) ,乙厂生产3033
1的应抽取9×=3(个) ; 3
第二步 用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个.这些篮球便组成了我们要抽取的样本.
(2)总体容量较小,用抽签法.
第一步 将30个篮球编号,编号为00,01,…,29;
第二步 将以上30个编号分别写在一张小纸条上,揉成小球,制成号签;
第三步 把号签放入一个不透明的袋子中,充分搅匀;
第四步 从袋子中逐个抽取3个号签,并记录上面的号码;
第五步 找出与所得号码对应的篮球.
(3)总体容量较大,样本容量较小,适宜用随机数法.
第一步 将300个篮球用随机方式编号,编号为001,002,…,300;
第二步 在随机数表中随机的确定一个数作为开始,如第3行第5列的数“3”开始.任选一个方向作为读数方向,比如向右读;
第三步 从数“3”开始向右读,每次读三位,凡不在001~300中的数跳过去不读,遇到已经读过的数也跳过去不读,便可依次得到241,242,232,283,039,101,158,272,266,166这10个号码,这就是所要抽取的10个样本个体的号码.
(4)总体容量较大,样本容量也较大,适宜用系统抽样法.
第一步 将300个篮球用随机方式编号,编号为000,001,002,…,299,并分成30段; 第二步 在第一段000,001,002,…,009这十个编号中用简单随机抽样抽出一个(如002) 作为起始号码;
第三步 将编号为002,012,022,…,292的个体抽出,组成样本.
1.三种抽样的适用范围不同,各自的特点也不同,但各种方法间又有密切联系.在应用时要根据实际情况选取合适的方法.
2.三种抽样中每个个体被抽到的可能性都是相同的.
3.某社区有700户家庭,其中高收入家庭225户,中等收入家庭400户,低收入家庭75户.为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本,记作①;某中学高二年级有12名篮球运动员,要从中选出3人调查投篮命中率情况,记作②;从某厂生产的802辆轿车中抽取40辆测试某项性能,记作③. 为完成上述三项抽样,则应采取的抽样方法是( )
A .①简单随机抽样,②系统抽样,③分层抽样 B .①分层抽样,②简单随机抽样,③系统抽样 C .①简单随机抽样,②分层抽样,③系统抽样 D .①分层抽样,②系统抽样,③简单随机抽样
解析:对于①,总体由高收入家庭、中等收入家庭和低收入家庭差异明显的三部分组成,而所调查的指标与收入情况密切相关,所以应采用分层抽样;对于②,总体中的个体数较少,而且所调查内容对12名调查对象是平等的,应采用简单随机抽样;对于③,总体中的个体数较多,且个体之间差异不明显,样本中个体数也较多,应采用系统抽样.答案:B
一个单位有职工160人,其中有业务人员112人,管理人员16人,后勤服务人员32人,为了了解职工的某种情况,要从中抽取一个容量为20的样本,试确定业务人员、管理人员、后勤服务人员各抽取的人数是多少?
[解] 法一:三部分所含个体数之比为112∶16∶32=7∶1∶2,设三部分各抽个体数为7x ,x, 2x ,则由7x +x +2x =20得x =2. 故业务人员、管理人员、后勤服务人员抽取的个体数分别为14,2和4.
法二:由160÷20=8,所以可在各层人员中按8∶1的比例抽取,又因为112÷8=14,16÷8=2,32÷8=4,所以业务人员14人,管理人员2人,后勤服务人员4人.
201法三:因为共有职工160人,所抽取的人数为20,所以样本容量与总体容量之比为 1608
111则业务人员应抽取11214人,管理人员应抽16×=2人,后勤服务人员应抽32×888
=4人.
课堂训练:
1.简单随机抽样、系统抽样、分层抽样之间的共同点是( )
A .都是从总体中逐个抽取 B .将总体分成几部分,按事先确定的规则在各部分中抽取
C .抽样过程中每个个体被抽取的机会相同 D .将总体分成几层,分层进行抽取 解析:简单随机抽样、系统抽样、分层抽样的共同点是:在抽样过程中每个个体被抽取的概率是相同的.答案:C
2.某市场想通过检查发票及销售记录的2%来快速估计每月的销量总额.采取如下方法:从某本发票的存根中随机抽一张,如15号,然后按顺序往后将65号, 115号,165号,…抽出,发票上的销售额组成一个调查样本.这种抽取样本的方法是( )
A .抽签法 B.随机数法 C .系统抽样法 D .其他的抽样方法 解析:上述抽样方法是将发票平均分成若干组,每组50张.从第一组中抽取15号,以后各组抽取15+50n (n ∈N *) 号,符合系统抽样的特点.答案:C
3.某校高三年级有男生500人,女生400人.为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )
A .简单随机抽样法 B .抽签法 C .随机数表法 D .分层抽样法
解析:样本由差异明显的几部分组成,抽取的比例由每层个体占总体的比例确定,即为分层抽样法.答案:D
4.将一个总体分为A 、B 、C 三层,其个体数之比为5∶3∶2,若用分层抽样方法抽取容量为100的样本,则应从C 中抽取的个体数为________.
解析:2100=20. 答案:20 5+3+2
5.将参加数学夏令营的100名同学编号为001,002,…,100. 现采用系统抽样方法抽取一个容量为25的样本,且第一段中随机抽得的号码为004,则在046至078号中,被抽中的人数为________.
解析:抽样距为4,第一个号码为004,故001~100中是4的整数倍的数被抽出,在046至078号中有048,052,056,060,064,068,072,076,共8个.答案:8
6.某中学有教职工300人,分为教学人员、管理人员、后勤服务人员三部分,其组成比例为8∶1∶1. 现用分层抽样从中抽取容量为20的样本,请写出抽样的过程.
830010201解:抽样过程如下:(1)确定抽样比=(2)确定各层抽样数目为16, 3001515
11300300×10102=2;(3)用系统抽样法从教学人员中抽取16人,用简单随机抽样1515
法分别从管理人员和后勤服务人员中各抽取2人;(4)将上述各层所抽的个体合在一起即为所要抽取的样本.
形成性测试:
一、选择题
1.某牛奶生产线上每隔30分钟抽取一袋进行检验,该抽样方法记为①;从某中学的30名数学爱好者中抽取3人了解学业负担情况,该抽样方法记为②. 那么( )
A .①是系统抽样,②是简单随机抽样 B .①是简单随机抽样,②是简单随机抽样
C .①是简单随机抽样,②是系统抽样 D .①是系统抽样,②是系统抽样
解析:对于①,因为每隔30分钟抽取一袋,是等间距抽样,故①为系统抽样;对于②,总体数量少,样本容量也小,故②为简单随机抽样.答案:A
2.(2012·四川高考) 交通管理部门为了解机动车驾驶员(简称驾驶员) 对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N ,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N 为( )
A .101 B .808 C .1 212 D .2 012
解析:依题意得知,甲社区驾驶员的人数占总人数的
12N =808. 答案:B 101
3.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是( )
A .12,24,15,9
C .8,15,12,5 B .9,12,12,7 D .8,16,10,6 121296=因此有N 12+21+25+43101
解析:由题意,各种职称的人数比为160∶320∶200∶120=4∶8∶5∶3,所以抽取的具有高、中、初级职称的人数和其他人员的人数分别为40×
310,406. 答案:D 20
4.下列抽样中不是系统抽样的是( )
A .从标有1~15号的15个球中,任选3个作为样本.将15个球按从小号到大号排序,随机选i 0号作为起始号码,以后选i 0+5,i 0+10(超过15则从1再数起) 号入样
B .工厂生产的产品,在用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽取一件产品进行检验
C .进行某一市场调查时,规定在商场门口随机抽取一个人进行询问调查,直到调查到事先规定的调查人数为止
D .在报告厅对与会听众进行调查,通知每排(每排人数相等) 座位号为14的听众留下来座谈
解析:分析各选项中抽样的特点,与系统抽样的概念、特点进行比较.A 、D 显然是系统抽样.B 项中,传送带的速度是恒定的,实际上是将某一段时间内生产的产品分成一组,且可以认为这些产品已经排好,又总在某一位置抽取样品,这正好符合系统抽样的概念.选项C 因事先不知道总体的个数,而且抽样时不能保证每个个体等可能入样,因此它不是系统抽样.答案:C
5.某学校有职工140人,其中教师91人,教辅行政人员28人,总务后勤人员21人.为485=8,40×=16,40×=202020
了了解职工的某种情况,要从中抽取一个容量为20的样本.以下的抽样方法中,依次为简单随机抽样、系统抽样、分层抽样顺序的是( )
方法1:将140人从1~140编号,然后制作出编号1~140的形状、大小相同的号签,并将号签放入同一箱子里均匀搅拌,然后从中抽取20个号签,编号与号签相同的20个人被选出;
方法2:将140人分成20组,每组7人,并将每组7人按1~7编号,在第一组采用抽签法抽出k 号(1≤k ≤7) ,其余各组k 号也被抽出,20个人被选出;
方法3:按20∶140=1∶7的比例,从教师中抽出13人,从教辅行政人员中抽出4人,从总务后勤人员中抽出3人.从各类人员中抽取所需人员时,均采用随机数法,可抽到20人.
A .方法2,方法1,方法3 B .方法2,方法3,方法1
C .方法1,方法2,方法3 D .方法3,方法1,方法2
解析:结合简单随机抽样、系统抽样、分层抽样的定义判断.答案:C
二、填空题
6.(2012·浙江高考) 某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为________.
280解析:由分层抽样得,此样本中男生人数为560×=160. 答案:160 560+420
7.(2013·日照高一检测) 某学校高一、高二、高三三个年级共有学生3 500人,其中高
1三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按100
分层抽样的方法抽取样本,则应抽取高一学生数为________.
x x x x 解析:若设高三学生数为x ,则高一学生数为高二学生数为300,所以有x +++3002222
800=3 500,解得x =1 600.故高一学生数为800,因此应抽取高一学生数为=8. 答案:8 100
8.(2013·中山高一检测) 一个总体中有100个个体,随机编号为0、1、2、…、99,依编号顺序平均分成10个小组,组号依次为1、2、3、…、10. 现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同.若m =6,则在第7组中抽取的号码是________.
解析:第k 组的号码为(k -1)10,(k -1)10+1,…,(k -1)·10+9,当m =6、k =7时,第k 组抽取的号码m +k 的个位数字为3,所以(7-1) ×10+3=63. 答案:63
三、解答题
9.为了调查某路口一个月的车流量情况,交警采用系统抽样的方法,样本距为7,从每周中随机抽取一天,他正好抽取的是星期日,经过调查后做出报告.你认为交警这样的抽样方法有什么问题?应当怎样改进?如果是调查一年的车流量情况呢?
解:交警所统计的数据以及由此所推断出来的结论,只能代表星期日的交通流量.由于星期日是休息时间,很多人不上班,不能代表其他几天的情况.
改进方法可以将所要调查的时间段的每一天先随机地编号,再用系统抽样方法来抽样,或者使用简单随机抽样来抽样亦可.
如果是调查一年的交通流量,使用简单随机抽样法显然已不合适,比较简单可行的方法是把样本距改为8.
10.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组
1的职工占参加活动总人数的,且该组中,青年人占50%,中年人占40%,老年人占10%.4
为了了解各组不同的年龄层的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取容量为200的样本.试求:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
解:(1)设登山组人数为x ,游泳组中,青年人、中年人、老年人各占比例分别为a ,b ,x ·40%+3xb x ·10%+3xc c ,47.5%10%.解得b =50%,c =10%.故a =1-50%-10%4x 4x
=40%.即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%.(2)游泳组
33中,抽取的青年人人数为200××40%=60;抽取的中年人人数为200××50%=75; 44
3抽取的老年人人数为200×10%=15. 4