用样本估计总体
用样本估计总体
1.作频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差). (2)(3) (4)列频率分布表. (5)2.频率分布折线图和总体密度曲线
(1)频率分布折线图:就得到频率分布折线图. (2)线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 3.茎叶图
统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数. 4.标准差和方差
(1)(2)标准差: s=
1
(x1-x)2+(x2-x)2+„+(xn-x)2]. n
1
(3)方差:s2x1-x)2+(x2-x)2+„+(xn-x)2](xn是样本数据,n是样本容量,x是样
n本平均数). [知识拓展]
1.频率分布直方图的特点
频率频率
(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示,频率=组距×组距组距(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.
(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. 2.平均数、方差的公式推广
(1)若数据x1,x2,„,xn的平均数为x,那么mx1+a,mx2+a,mx3+a,„,mxn+a的平均数是mx+a.
(2)数据x1,x2,„,xn的方差为s2.
①数据x1+a,x2+a,„,xn+a的方差也为s2; ②数据ax1,ax2,„,axn的方差为a2s2. 【思考辨析】
判断下面结论是否正确(请在括号中打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )
(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )
(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( ×
)
1.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是( ) A.91.5和91.5 C.91和91.5 答案 A
解析 这组数据由小到大排列为87,89,90,91,92,93,94,96, 1
∴中位数为×(91+92)=91.5.
2
1
平均数为×(87+89+90+91+92+93+94+96)=91.5.
82.一个容量为66的样本,数据的分组及各组的频数如下:
[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12
[35.5,39.5) 7 [39.5,43.5) 3
根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是(
)
B.91.5和92 D.92和92
1112A. B. 6323答案 B
解析 由已知,样本容量为66,而落在[31.5,43.5)内的样本数为12+7+3=22,故所求概率221为=663
3.(2014·四川)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( ) A.总体 C.样本的容量 答案 A
解析 调查的目的是“了解某地5 000名居民某天的阅读时间”,所以“5 000名居民的阅读时间的全体”是调查的总体.
4.某中学为了了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.
B.个体
D.从总体中抽取的一个样本
答案 600
解析 由直方图易得数学考试中成绩小于60分的频率为(0.002+0.006+0.012)×10=0.2,所以所求分数小于60分的学生数为3 000×0.2=
600.
题型一 频率分布直方图的绘制与应用
例1 某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:
(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;
(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分. 思维点拨 图中各小长方形的面积和等于1.
解 (1)设分数在[70,80)内的频率为x,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如图所示.
(2)平均分:45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分). 思维升华 (1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.
(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.
(2013·陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频
率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为(
)
A.0.09 B.0.20 C.0.25 D.0.45 答案 D
解析 设区间[25,30)对应矩形的另一边长为x,则所有矩形面积之和为1,即(0.02+0.04+0.06+0.03+x)×5=1,解得x=0.05.产品为二等品的概率为0.04×5+0.05×5=0.45. 题型二 茎叶图的应用
例2 如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有( ) A.a1>a2
B.a2>a1
C.a1=a2 D.a1,a2的大小与m的值有关
思维点拨 去掉第一行和第三行的数,只计算第二行叶上的数即可. 答案 B
解析 去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2>a1.故选B.
思维升华 由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表试题时,就要充分使用这个图表提供的数据进行相关的计算或者对某些问题作出判断.
(2013·山东)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分
数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
8 9
7 4
7 0
1
x
9
则7个剩余分数的方差为( ) 116366A. B. C.36 D.977答案 B
87+94+90+91+90+90+x+911解析 由题意知91,解得x=4.所以s2=[(87-91)2+(94
77-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2] 136
=(16+9+1+0+1+9+0)77
题型三 用样本的数字特征估计总体的数字特征
例3 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
(1)分别求出两人得分的平均数与方差;
(2)根据图和上面算得的结果,对两人的训练成绩作出评价. 思维点拨 (1)先通过图象统计出甲、乙二人的成绩;
(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价. 解 (1)由题图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分;
乙:13分,14分,12分,12分,14分. 10+13+12+14+16x甲==13,
513+14+12+12+14x乙==13,
5
122222
s2甲=[(10-13)+(13-13)+(12-13)+(14-13)+(16-13)]=4, 5122222s2乙=[(13-13)+(14-13)+(12-13)+(12-13)+(14-13)]=0.8. 5
2(2)由s甲>s2乙可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
(2013·江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如
下:
答案 2
1
解析 x甲=+91+90+89+93)=90,
51
x乙=(89+90+91+88+92)=90,
5
122222s2甲=[(87-90)+(91-90)+(90-90)+(89-90)+(93-90)]=4, 5122222s2乙=[(89-90)+(90-90)+(91-90)+(88-90)+(92-90)]=2. 5
高考中频率分布直方图的应用
典例:(2014·山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,„,第五组,如图是根据试验数据制成的频率
分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(
)
A.6 B.8 C.12 D.18 答案 C
解析 志愿者的总人数为
20
50,
(0.16+0.24)×1
所以第三组人数为50×0.36=18, 有疗效的人数为18-6=12.
温馨提醒 本题的难点是对频率分布直方图意义的理解以及利用这个图提供的数据对所提问题的计算,频率分布直方图中纵轴上的数据是频率除以组距,组距越大该数据越小,在解答这类问题时要特别注意
.
方法与技巧
1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.
2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.
3.若取值x1,x2,„,xn的频率分别为p1,p2,„,pn,则其平均值为x1p1+x2p2+„+xnpn;若x1,x2,„,xn的平均数为x,方差为s2,则ax1+b,ax2+b,„,axn+b的平均数为ax+b,方差为a2s2. 失误与防范
频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.
A组 专项基础训练 (时间:45分钟)
1.(2013·重庆)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的概率为( )
1 2 3
A.0.2 C.0.5 答案 B
4解析 10个数据落在区间[22,30)内的数据有22,22,27,29共4个,因此,所求的频率为=0.4.
10故选B.
2.(2014·陕西)某公司10位员工的月工资(单位:元)为x1,x2,„,x10,其均值和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A.x,s2+1002 C.x,s2 答案 D 解析
x1+x2+„+x10
x,yi=xi+100,所以y1,y2,„,y10的均值为x+100,方差不变,
10
B.x+100,s2+1002 D.x+100,s2
8 1 0
9 2 0
2 3
7
9
B.0.4 D.0.6
故选D.
3.(2013·辽宁)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是(
)
A.45 B.50 C.55 D.60
答案 B
解析 由频率分布直方图,知低于60分的频率为 (0.01+0.005)×20=0.3. ∴该班学生人数n=
15
50. 0.3
4.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为mo,平均值为x,则(
)
A.me=mo=x C.me<mo<x 答案 D
5+6解析 30个数中第15个数是5,第16个数是6,所以中位数me==5.5,众数mo=5,
2平均值x=
3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2179
=∴mo
3030
5.(2013·福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为(
)
B.me=mo<x D.mo<me<x
A.588 B.480 C.450 D.120 答案 B
解析 少于60分的学生人数600×(0.05+0.15)=120(人),∴不少于60分的学生人数为480人.
6.某中学高三年级从甲、乙两个班级各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则x+y的值为________.
答案 8
解析 依题意,甲班学生的平均分
78+79+85+80+92+96+80+x85,故x=5.
7
乙班学生成绩的中位数是83,故其成绩为76,81,81,83,91,91,96, ∴y=3,∴x+y=8.
7.在样本频率分布直方图中,共有5个小长方形,已知中间一个小长方形的面积是其余41
10,则这个样本的容量是________.
3答案 40
解析 设中间小长方形的面积为S, 1
则S=-S),3S=1-S,
311∴S.
44∵频数=10,∴样本容量=
频数10
=40. 频率1
4
8.若某产品的直径长与标准值的差的绝对值不超过1 mm时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:
(1)将上面表格中缺少的数据填在相应位置;
(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率; (3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.
解 (1)如下表所示频率分布表.
(2)(1,3]内的概率约为 0.50+0.20=0.70.
5 000×205020
(3)设这批产品中的合格品数为x件,依题意,解得x=-20=1 980.
5 000x+2050所以该批产品的合格品件数大约是1 980件.
9.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图(中间的数字表示身高的百位、十位数,旁边的数字分别表示身高的个位数)如图所示.
(1)根据茎叶图判断哪个班的平均身高较高; (2)计算甲班的样本方差;
(3)现从乙班这10名同学中随机抽取两名身高不低于173 cm的同学,求身高为176 cm的同学被抽中的概率.
解 (1)由茎叶图可知:甲班同学身高集中在162~179 cm之间,而乙班同学身高集中在170~179之间,
所以乙班的平均身高较高. (2)∵x甲=170, ∴s2甲=
1
[(182-170)2+(179-170)2+(179-170)2+(171-170)2+(170-170)2+(168-10
170)2+(168-170)2+(163-170)2+(162-170)2+(158-170)2]=57.2.
(3)记“身高为176 cm的同学被抽中”为事件A.从乙班10名同学中抽出两名身高不低于173 cm的同学有:(173,176),(173,178),(173,179),(173,181),(176,178),(176,179),(176,181),(178,179),(178,181),(179,181),共10个基本事件,而事件A含有4个基本事件,故P(A)42==105
B组 专项能力提升 (时间:15分钟)
10.(2013·四川)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是(
)
答案 A
解析 由于频率分布直方图的组距为5,排除C、D,又[0,5),[5,10)两组各一人,排除B,应选A.
11.(2013·安徽)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( ) A.这种抽样方法是一种分层抽样 B.这种抽样方法是一种系统抽样
C.这五名男生成绩的方差大于这五名女生成绩的方差 D.该班男生成绩的平均数小于该班女生成绩的平均数
答案 C
1
解析 x男=+94+88+92+90)=90,
51
x女=(88+93+93+88+93)=91,
5
122222
s2男=[(86-90)+(94-90)+(88-90)+(92-90)+(90-90)]=8, 5122222s2女=[(88-91)+(93-91)+(93-91)+(88-91)+(93-91)]=6. 5
12.如果数据x1,x2,„,xn的平均数为x,方差为s2,则2x1+3,2x2+3,„,2xn+3的平均数和方差分别为( ) A.x和s2 C.2x+3和s2 答案 B
11
解析 方法一 平均数为x1+3+2x2+3+„+2xn+3)=[2(x1+x2+…+xn)+3n]
nn=2x+3;
1
方差为x1+3)-(2x+3)]2+[(2x2+3)-(2x+3)]2+„+[(2xn+3)-(2x+3)]2}
n1
=[4(x1-x)2+4(x2-x)2+„+4(xn-x)2] n=4s2.
方法二 原数据乘以2加上3得到一组新数据,则由平均数、方差的性质可知得到的新数据的平均数、方差分别是2x+3和4s2.
13.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于
100 cm.
B.2x+3和4s2 D.2x+3和4s2+12s+9
答案 24
解析 底部周长在[80,90)的频率为0.015×10=0.15,
底部周长在[90,100)的频率为0.025×10=0.25,
样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24.
14.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=____________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
答案 0.030 3
1-0.700解析 ∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴a==0.030.
10由题意知,身高在[120,130),[130,140),[140,150]内的学生分别为30人,20人,10人,183
∴由分层抽样可知抽样比为
6010∴在[140,150]中选取的学生应为3人.