概率与统计专题
7. 概率与统计
1. 随机抽样方法
简单随机抽样、系统抽样、分层抽样的共同点是抽样过程中每个个体被抽取的机会相等,且是不放回抽样.
[问题1] 某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭. 在建设幸福社区的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次抽取的总户数为________. 答案 24
6480-200-160
解析 由抽样比例可知=x =24.
x 480
2. 对于统计图表问题,求解时,最重要的就是认真观察图表,从中提取有用信息和数据. 对于频率分布直方图,应注意的是图中的每一个小矩形的面积是数据落在该区间上的频率. 茎叶图没有原始数据信息的损失,但数据很大或有多组数据时,茎叶图就不那么直观、清晰了. [问题2] (2015·湖南) 在一次马拉松比赛中,35名运动员的成绩(单位:分钟) 的茎叶图如图所示. 13 14 15
0 1 0
0 1 1
3 1 2
4 2 2
5 2 3
6 2 3
6 3 3
8 3
8 4
8 4
9 5
5
5
6
6
7
8
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________. 答案 4
解析 由题意知,将1~35号分成7组,每组5名运动员,落在区间[139,151]的运动员共有4组,故由系统抽样法知,共抽取4名.
3. 在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值. 平均数的估计值等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和,众数是最高矩形的中点的横坐标.
[问题3] 某公司为了解用户对其产品的满意度,随机调查了40个用户,根据用户满意度的评分制成频率分布直方图(如下) ,则该地区满意度评分的平均值为
________.
答案 77.5
解析 由直方图估计评分的平均值为55×0.05+65×0.2+75×0.35+85×0.25+95×0.15=77.5.
4. 互斥事件的概率公式P (A +B ) =P (A ) +P (B ) (1)公式适合范围:事件A 与B 互斥. (2)P (A ) =1-P (A ).
[问题4] 抛掷一枚骰子,观察掷出的点数,设事件A 为出现奇数点,事件B 为出现2点,11
已知P (A ) =P (B ) =,则出现奇数点或2点的概率之和为________.
262
答案
35. 古典概型
m
P (A ) =其中,n 为一次试验中可能出现的结果总数,m 为事件A 在试验中包含的基本事件
n 个数).
[问题5] (2015·广东) 已知5件产品中有2件次品,其余为合格品. 现从这5件产品中任取2件,恰有一件次品的概率为________. 答案 0.6
解析 5件产品中有2件次品,记为a ,b ,有3件合格品,记为c ,d ,e ,从这5件产品中任取2件,结果有(a ,b ) ,(a ,c ) ,(a ,d ) ,(a ,e ) ,(b ,c ) ,(b ,d ) ,(b ,e ) ,(c ,d ) ,(c ,e ) ,6
(d ,e ) 共10种. 恰有一件次品的结果有6种,则其概率为p ==0.6.
106. 几何概型
一般地,在几何区域D 内随机地取一点,记事件“该点在其内部一个区域d 内”为事件A ,d 的度量则事件A 发生的概率为P (A ) =. 此处D 的度量不为0,其中“度量”的意义依D 确
D 的度量定,当D 分别是线段、平面图形和立体图形时,相应的度量分别为长度、面积和体积等. 构成事件A 的区域长度(面积或体积)
即P (A ) =试验的全部结果所构成的区域长度(面积或体积)
[问题6] 在棱长为2的正方体ABCD —A 1B 1C 1D 1中,点O 为底面ABCD
的中心,在正方体
ABCD —A 1B 1C 1D 1内随机取一点P ,则点P 到点O 的距离大于1的概率为________. π
答案 1-12
解析 记“点P 到点O 的距离大于1”为A , 14
23-×13
23π
P (A ) =12127. 解排列、组合问题的常用策略
相邻问题捆绑法;相间隔问题插空法;定位问题优先法;多元问题分类法;至多至少问题间接法;相同元素分组可采用隔板法,数量不大时可以逐一排出结果.
[问题7] 4个不同的小球放入编号为1、2、3、4的4个盒中,则恰有1个空盒的放法共有________种. 答案 144
11
C 24C 2C 1
解析 把4个球分成3组,每组至少1个,即分的小球个数分别为2,1,1的3组,有.
A 2
最后将三组球放入4个盒中的3个,有分配方法数144(种).
8. 二项式系数的性质
m n
(1)对称性:C n =C n
-m
11
C 24C 2C 133
A 4种,因此,放法共有×A 4=A 2
(m =0,1,2,„,n ).
-
01n 35024n 1
(2)系数和:C n +C n +„+C n =2n ,C 1. n +C n +C n +„=C n +C n +C n +„=2
n
(3)最值:n 为偶数时,n +1为奇数,中间一项的二项式系数最大且为第1) 项,二项式系
2n +1n +1
数为c ;n 为奇数时,(n +1) 为偶数,中间两项的二项式系数最大为第+1
22项,其二项式系数为c [问题8] 已知(+(1)求n ;
(2)求第三项的二项式系数及该项的系数. 112
解 (1)前三项系数为11n ,C n 成等差数列, 24
1122所以21n =1n ,即n -9n +8=0,得n =1(舍) 或n =8. 24(2)由n =8可知其通项公式为 T r +1=C r 8x )
8-r
n
2n
n -12
n =
c
n +12n .
14n
) 展开式中,前三项系数成等差数列. 2x
14r 1r r 4-4r 2(=C 8x ,r =0,1,„,8,所以第三项的二项式系数为C 8=28, 2x 2
3
1
第三项系数为() 2C 2=7.
289. 条件概率 P (A |B ) =
P (AB )
P (B )
3
[问题9] 设A 、B 为两个事件,若事件A 和B 同时发生的概率为,在事件A 发生的条件
101
下,事件B A 发生的概率为________.
23答案
5
10. 离散型随机变量的均值、方差
(1)离散型随机变量的均值、方差:E (X ) =x 1p 1+x 2p 2+„+x i p i +„+x n p n 为随机变量X 的均值,V (X ) =[x 1-E (X )]2p 1+[x 2-E (X )]2p 2+„+[x n -E (X )]2p n 叫做这个离散型随机变量X 的方差.
(2)两点分布与二项分布的均值、方差.
①若X 服从两点分布,则E (X ) =p ,V (X ) =p (1-p ). ②若X ~B (n ,p ) ,则E (X ) =np ,V (X ) =np (1-p ).
[问题10] 若随机变量ξ的概率分布如下表,则E (ξ) 的值为________.
答案
20 9
1
解析 根据概率之和为1,求出x =,
1820
则E (ξ) =0×2x +1×
3x +„+5x =40x =.
9
易错点1 抽样方法理解不准
例1 一个总体中100个个体的编号为0,1,2,3,„,99,并依次按其分为10个小组,组号为0,1,2,„,9. 要用系统抽样的方法抽取一个容量为10的样本,规定如果第0组(号码0~9) 随机抽取的号码为l ,那么依次错位地抽取后面各组的号码,即第k 组中抽取的号码的个位数为l +k 或l +k -10(如果l +k ≥10). 若l =6,则所抽取的第5组的号码是________. 易错分析 本题易错点有两个:一是忽视题中对组号的描述,误以为第一个号码6为第一组的号码导致错误;二是忽视系统抽样号码抽样法则的制定,误以为组距为10,所以每组抽取号码的个位数都为6. 所以解决此类问题,一定要根据题中的条件准确进行编号与抽样.
解析 由题意,第0组抽取的号码为6,则第一组抽取的号码的个位数为6+1=7,所以选17.
因为7+1=8,第二组抽取号码的个位数为8,故选28. 因为8+1=9,第三组抽取号码的个位数为9,故选39.
因为9+1=10≥10,9+1-10=0,第四组抽取号码的个位数为0,故选40. 因为0+1=1,第五组抽取号码的个位数为1,故选51. 答案 51
易错点2 误解基本事件的等可能性
例2 若将一枚质地均匀的骰子(一种各面上分别标有1,2,3,4,5,6个点的正方体玩具) 先后抛掷2次,则出现向上的点数之和为4的概率为________.
易错分析 解本题时易出现的错误在于对等可能性事件的概率中“基本事件”以及“等可能性”等概念的理解不深刻,错误地认为基本事件总数为11(点数和等于2,3,4,5,6,7,8,9,10,11,12) ,或者将点数和为4的事件错误地计算为(1,3)(2,2)两种,从而导致出错.
解析 将先后掷2次出现向上的点数记作点坐标(x ,y ) ,则共可得点坐标的个数为6×6=36,而向上点数之和为4的点坐标有(1,3),(2,2),(3,1),共3个,故先后掷2次,出现向上的点31数之和为4的概率P =3612答案
1 12
易错点3 几何概型中“测度”确定不准
例3 在等腰直角三角形ABC 中,直角顶点为C . (1)在斜边AB 上任取一点M ,求AM <AC 的概率;
(2)在∠ACB 的内部,以C 为端点任作一条射线CM ,与线段AB 交于点M ,求AM <AC 的概率.
易错分析 本题易出现的问题是混淆几何概型中对事件的度量方式,不注意题中两问中点M 生成方式的差异,误以为该题两问中的几何概型都是用线段的长度来度量造成错解. 解 (1)如图所示,AB =AC .
由于点M 是在斜边AB 上任取的,所以点M 等可能分布在线段AB 上,因此基本事件的区域应是线段AB . 所以P (AM <AC ) AC 2
. 2AC
2
(2)由于在∠ABC 内作射线CM ,等可能分布的是CM 在∠ACB 内的任一位置(如图所示) ,因ππ-42∠ACC ′3
此基本事件的区域应是∠ACB ,所以P (AM <AC ) =.
π4∠ACB
2
易错点4 互斥事件概念不清
例4 对飞机连续射击两次,每次发射一枚炮弹. 设A ={两次都击中飞机},B ={两次都没击中飞机},C ={恰有一次击中飞机},D ={至少有一次击中飞机},其中彼此互为互斥事件的是________;互为对立事件的是________.
易错分析 对事件互斥意义不明确,对事件的互斥与对立之间的关系不清楚,就会出现错误的判断. 对立事件和互斥事件都不可能同时发生,但对立事件必有一个要发生,而互斥事件可能都不发生. 所以两个事件对立,则两个事件必是互斥事件;反之,两事件是互斥事件,但未必是对立事件.
解析 因为A ∩B =∅,A ∩C =∅,B ∩C =∅,B ∩D =∅,故A 与B ,A 与C ,B 与C ,B 与D 为彼此互斥事件,而B ∩D =∅,B ∪D =Ω,故B 与D 互为对立事件. 答案 A 与B ,A 与C ,B 与C ,B 与D B 与D
易错点5 排列、组合问题混淆
例5 如图所示,A ,B ,C ,D 是海上的四个小岛,要建三座桥,将这四个岛连结起来,不同的建桥方案共有多少种?
易错分析 搞不清几个元素之间有无顺序,混淆排列与组合的区别. 解 由题意可能有两种结构,如图:
第一种:,第二种:
对于第一种结构,连结方式只需考虑中心位置的情况,共有C14种方法. 对于第二种结构,有C24A22种方法. 所以总共有C14+C24A22=16(种) 方法.
易错点6 概率计算时是否有序理解不清
1
例6 袋子A 和B 中装有若干个均匀的红球和白球,从A 中摸出一个红球的概率是,从B
3中摸出一个白球的概率为p . 从A 中有放回地摸球,每次摸出一个,有3次摸到红球即停止
.
(1)求恰好摸5次停止的概率;
(2)记5次之内(含5次) 摸到红球的次数为ξ,求随机变量ξ的概率分布.
易错分析 注意题中的摸球是“有放回地”,另外条件“有3次摸到红球即停止”在解题中要充分考虑.
解 (1)恰好摸5次停止的概率为 122218P =C 2×) ×() ×=. 4
33381(2)随机变量ξ的取值为0,1,2,3. 由n 次独立重复试验概率公式
k n k
P n (k ) =C k , n p (1-p )
-
1532得P (ξ=0) =C 0, 5×(1-=324311480P (ξ=1) =C 1, 5×(1-) =[1**********]P (ξ=2) =C 2 5××(1=3324332+80×217P (ξ=3) =1.
24381故随机变量ξ的概率分布为
1. 某学校利用系统抽样的方法,从学校高三年级全体1000名学生中抽50名学生做学习状况问卷调查. 现将1000名学生从1到1000进行编号,共分50组. 在第一组中随机抽取一个号,如果抽到的是17号,则第8组中应取的号码是________. 答案 157
解析 根据系统抽样法的特点,可知抽取出的编号成首项为17,公差为20的等差数列,所以第8组的编号是17+(8-1) ×20=157.
2.(2016·江苏省扬州中学高三月考) 甲、乙两个样本数据的茎叶图(如图) ,则甲、乙两样本方差中较小的一个方差是_________.
答案 23
解析 由茎叶图知,乙的稳定性较好,方差较小,x 8+11+12+12+20+21
=14,由方
6
1
差公式可得:s 2=-14) 2+(11-14) 2+(12-14) 2+(12-14) 2+(20-14) 2+(21-14) 2]=23.
63. 某路段检查站监控录像显示,在某时段内,有1000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为如图所示的频率分布直方图,则估计在这一时段内通过该站的汽车中车速不小于90km/h的约有________辆.(注:分析时车速均取整数)
答案 300
解析 由图可知,车速大于等于90km /h的车辆未标出频率,而小于90 km/h 的都标出了,故考虑对立事件. 由题图知车速小于90km /h的汽车总数的频率之和为(0.01+0.02+0.04)×10=0.7,所以车速不小于90 km/h 的汽车总数的频率之和为1-0.7=0.3. 因此在这一时段内通过该站的车速不小于90km/h的汽车有1000×0.3=300(辆).
4. 某蓝球选手近五场比赛的上场时间分别为:9.7,9.9,10.1,10.2,10.1(单位:分钟) ,则这组数据的方差为________. 答案 0.032
解析 ∵某蓝球选手近五场比赛的上场时间分别为: 9.7,9.9,10.1,10.2,10.1(单位:分钟) , ∴这组数据的平均数为
1
x =+9.9+10.1+10.2+10.1) =10,
5∴这组数据的方差为
1
s 2=[(9.7-10) 2+(9.9-10) 2+(10.1-10) 2+(10.2-10) 2+(10.1-10) 2]=0.032.
5
5.(2015·福建改编) 如图,矩形ABCD 中,点A 在x 轴上,点B 的坐标为(1,0),且点C 与点D x +1,x ≥0,⎧⎪在函数f (x ) =⎨1的图象上. 若在矩形ABCD 内随机取一点,则此点取自阴影部
-x +1,x <0⎪⎩2分的概率等于________.
1答案
4
32113
解析 由图形知C (1,2),D (-2,2) ,∴S 四边形ABCD =6,S 阴=3×1=∴P =.
22646. 某单位在岗职工共620人,为了调查工人用于上班途中的时间,决定抽取62名工人进行调查,若采用系统抽样方法将全体工人编号等距分成62段,再用简单随机抽样法得到第一段的起始号码为004号,则第40段应抽取的个体编号为________. 答案 394
解析 620人分成62段,每段10人,按系统抽样,所抽取工人编号成等差数列,因此第40段的编号为4+(40-1) ×10=394.
7. 如图所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x ,y 的值分别为________,________.
答案 6 4
75+82+84+(80+x )+90+93
解析 x 甲=85,
6解得x =6,由题图可知y =4.
8.(2016·江苏省清江中学高三考前周练模拟) 甲、乙两同学决定利用“剪刀、石头、布”的划拳方式来确定由谁去参观科技展览活动,规则如下:“剪刀”赢“布”,“布”赢“石头”“石头”赢“剪刀”;只划拳一次. 若分出胜负,胜者参加;若没有分出胜负,即划的拳一样,则两人一起参加,那么甲去参观科技展览活动的概率为________. 2答案
3
解析 两人划拳,要么划的拳一样,要么不一样,即结果有三种:参观的人要么是甲,要么2
是乙,要么两人都去,所以甲去参加的概率为.
3
3
9. 已知某人投篮的命中率为,则此人投篮4次,至少命中3次的概率是________.
4答案
189256
解析 该人投篮4次,命中3次的概率为 3273⎛33⎛1-=; P 1=C 4
⎝4⎝464
3⎫481⎛该人投篮4次,命中4次的概率为P 2=C 444=⎝⎭256
.
2781189
故至少命中3次的概率是P =.
64256256
10. 某校校庆,各届校友纷至沓来,某班共来了n 位校友(n >8,且n ∈N *) ,其中女校友6位,组委会对这n 位校友登记制作了一份校友名单,现随机从中选出2位校友代表,若选出的2位校友是一男一女,则称为“最佳组合”.
1
(1)若随机选出的2位校友代表为“最佳组合”的概率不小于,求n 的最大值;
2
(2)当n =12时,设选出的2位校友代表中女校友人数为X ,求随机变量X 的概率分布和均值E (X ).
解 (1)由题意可知,所选2人为“最佳组合”的概率为
1
C 112(n -6)n -6C 6
=C n n (n -1)
12(n -6)1
则. n (n -1)2
化简得n 2-25n +144≤0,解得9≤n ≤16, 故n 的最大值为16.
(2)由题意可得,X 的可能取值为0,1,2. C 25则P (X =0) =,
C 1222
1C 16C P (X =1) =,
C 1211
C 256
P (X =2) =
C 1222故X 的概率分布为
565
则E (X ) =0×+1×+2×=1.
221122