高中数学概率与统计知识点
高中数学之概率与统计
求等可能性事件、互斥事件和相互独立事件的概率
解此类题目常应用以下知识:
card(A)m
(1)等可能性事件(古典概型)的概率:P(A)=card(I)=;
等可能事件概率的计算步骤: 计算一次试验的基本事件总数n;
设所求事件A,并计算事件A包含的基本事件的个数m; 依公式
P(A)=
m
n求值;
答,即给问题一个明确的答复.
(2)互斥事件有一个发生的概率:P(A+B)=P(A)+P(B); 特例:对立事件的概率:P(A)+P(A)=P(A+A)=1. (3)相互独立事件同时发生的概率:P(A·B)=P(A)·P(B);
kkn-k
特例:独立重复试验的概率:Pn(k)=Cnp(1-p).其中P为事件A在一次试验中发生的
概率,此式为二项式[(1-P)+P]n展开的第k+1项. (4)解决概率问题要注意“四个步骤,一个结合”:
求概率的步骤是:
⎧等可能事件
⎪
⎪互斥事件 ⎨
⎪独立事件 ⎪
第一步,确定事件性质⎩n次独立重复试验
即所给的问题归结为四类事件中的某一种.
⎧和事件⎨
第二步,判断事件的运算⎩积事件
即是至少有一个发生,还是同时发生,分别运用相加或相乘事件.
m⎧
等可能事件: P(A)= ⎪n
⎪⎪互斥事件:P(A+B)=P(A)+P(B) ⎨
⎪独立事件:P(A⋅B)=P(A)⋅P(B) ⎪kkn-k⎪⎩n次独立重复试验:Pn(k)=Cnp(1-p)
第三步,运用公式求解
第四步,答,即给提出的问题有一个明确的答复.
2345
例1.在五个数字1,,,,中,若随机取出三个数字,则剩下两个数字都是奇数的概率是
(结果用数值表示).
C1333
P=3==.
C510
2 [解答过程]0.3提示:
例2.一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,
则指定的某个个体被抽到的概率为 .
511
P==..
10020 [解答过程]20提示:
例3.接种某疫苗后,出现发热反应的概率为0.80.现有5人接种该疫苗,至少有3人出现发
热反应的概率为__________.(精确到0.01)
[考查目的] 本题主要考查运用组合、概率的基本知识和分类计数原理解决问题的能力,以及推理和运算能力.
[解答提示]至少有3人出现发热反应的概率为
345C5⋅0.803⋅0.202+C5⋅0.804⋅0.20+C5⋅0.805=0.94.
故填0.94.
离散型随机变量的分布列 1.随机变量及相关概念
①随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母ξ、η等表示.
②随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. ③随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量. 2.离散型随机变量的分布列
①离散型随机变量的分布列的概念和性质
x„„,ξ取每一个值xi(i=1,一般地,设离散型随机变量ξ可能取的值为x1,x2,„„,i,
2,„„)的概率P(ξ=xi)=Pi,则称下表.
为随机变量ξ的概率分布,简称ξ的分布列.
由概率的性质可知,任一离散型随机变量的分布列都具有下述两个性质: (1)Pi≥0,i=1,2,„;(2)P1+P2+„=1. ②常见的离散型随机变量的分布列: (1)二项分布
n次独立重复试验中,事件A发生的次数ξ是一个随机变量,其所有可能的取值为0,1,2,„
kkn-k
n,并且Pk=P(ξ=k)=Cnpq,其中0≤k≤n,q=1-p,随机变量ξ的分布列如下:
称这样随机变量ξ服从二项分布,记作ξ~B(n,p),其中
kkn-k
Cnpq=b(k;n,p) .
n、
p为参数,并记:
(2) 几何分布
在独立重复试验中,某事件第一次发生时所作的试验的次数ξ是一个取值为正整数的离散型随机变量,“ξ=k”表示在第k次独立重复试验时事件第一次发生. 随机变量ξ的概率分布为:
例1.
厂家在产品出厂前,需对产品做检验,厂家将一批产品发给商家时,商家按合同规定也需随机抽取一定数量的产品做检验,以决定是否接收这批产品.
(Ⅰ)若厂家库房中的每件产品合格的概率为0.8,从中任意取出4件进行检验,求至少有1件是合格的概率;
(Ⅱ)若厂家发给商家20件产品中,其中有3件不合格,按合同规定该商家从中任取2件.都进行检验,只有2件都合格时才接收这批产品.否则拒收,求出该商家检验出不合格产品数ξ的分布列及期望Eξ,并求出该商家拒收这批产品的概率.
[解答过程](Ⅰ)记“厂家任取4件产品检验,其中至少有1件是合格品”为事件A 用对立事件A来算,有
P(A)=1-PA=1-0.24=0.9984
()
(Ⅱ)ξ可能的取值为0,1,2.
2C17136
P(ξ=0)=2=
C20190,
11C3C1751
=2
C20190,
P(ξ=1)=
C323
P(ξ=2)=2=
C20190
Eξ=0⨯
1365133
+1⨯+2⨯=[1**********].
记“商家任取2件产品检验,都合格”为事件B,则商家拒收这批产品的概率
P=1-P(B)=1-
13627
=
19095.
27
所以商家拒收这批产品的概率为95.
例12.
某项选拔共有三轮考核,每轮设有一个问题,能正确回答问题者进入下一轮考核,否则即被
423
淘汰. 已知某选手能正确回答第一、二、三轮的问题的概率分别为5、5、5,且各轮问题能
否正确回答互不影响.
(Ⅰ)求该选手被淘汰的概率;
(Ⅱ)该选手在选拔中回答问题的个数记为ξ,求随机变量ξ的分布列与数学期望. (注:本小题结果可用分数表示)
2,3),则 [解答过程]解法一:(Ⅰ)记“该选手能正确回答第i轮的问题”的事件为Ai(i=1,
P(A1)=
432
P(A2)=P(A3)=5,5,5,
∴该选手被淘汰的概率
P=P(A1+A1A2+A2A2A3)=P(A1)+P(A1)P(A2)+P(A1)P(A2)P(A3)
=
142433101+⨯+⨯⨯=
555555125.
2,3,(Ⅱ)ξ的可能值为1,
P(ξ=1)=P(A1)=
1
5,
428
P(ξ=2)=P(A1A2)=P(A1)P(A2)=⨯=
5525, 4312
P(ξ=3)=P(A1A2)=P(A1)P(A2)=⨯=
5525.
∴ξ的分布列为
1∴Eξ=1⨯+2⨯+3⨯=
5252525.
,2,3),则解法二:(Ⅰ)记“该选手能正确回答第i轮的问题”的事件为Ai(i=1
P(A2)=
32P(A3)=5,5.
P(A1)=
4
5,
432101=1-⨯⨯=
555125. ∴该选手被淘汰的概率P=1-P(A1A2A3)=1-P(A1)P(A2)P(A3)
(Ⅱ)同解法一.
离散型随机变量的期望与方差 随机变量的数学期望和方差 平.
222
⑵离散型随机变量的方差:Dξ=(x1-Eξ)p1+(x2-Eξ)p2+„+(xn-Eξ)pn+„;
(1)离散型随机变量的数学期望:Eξ=x1p1+x2p2+„;期望反映随机变量取值的平均水
方差反映随机变量取值的稳定与波动,集中与离散的程度.
2
⑶基本性质:E(aξ+b)=aEξ+b;D(aξ+b)=aDξ.
(4)若ξ~B(n,p),则 Eξ=np ; Dξ =npq(这里q=1-p) ;
如果随机变量ξ服从几何分布,P(ξ=k)=g(k,p),则
例1.甲、乙两名工人加工同一种零件,两人每天加工的零件数相等,所得次品数分别为ε、η,ε和η
Eξ=
q1
2
p,Dξ =p其中q=1-p.
则比较两名工人的技术水平的高低为 .
思路:一是要比较两名工人在加工零件数相等的条件下出次品数的平均值,即期望;二是要看出次品数的波动情况,即方差值的大小.
解答过程:工人甲生产出次品数ε的期望和方差分别为:
Eε=0⨯
613+1⨯+2⨯=0.7101010,
Dε=(0-0.7)2⨯
613
+(1-0.7)2⨯+(2-0.7)2⨯=0.891101010;
工人乙生产出次品数η的期望和方差分别为:
Eη=0⨯
532532
Dη=(0-0.7)2⨯+(1-0.7)2⨯+(2-0.7)2⨯=0.664+1⨯+2⨯=0.7
10101010
1010,
由Eε=Eη知,两人出次品的平均数相同,技术水平相当,但Dε>Dη,可见乙的技术比较
稳定.
小结:期望反映随机变量取值的平均水平;方差反映随机变量取值的稳定与波动,集中与离散的程度. 例2.
某商场经销某商品,根据以往资料统计,顾客采用的付款期数ξ的分布列为
商场经销一件该商品,采用1期付款,其利润为200元;分2期或3期付款,其利润为250元;分4期或5期付款,其利润为300元.η表示经销一件该商品的利润.
(Ⅰ)求事件A:“购买该商品的3位顾客中,至少有1位采用1期付款”的概率P(A); (Ⅱ)求η的分布列及期望Eη.
[解答过程](Ⅰ)由A表示事件“购买该商品的3位顾客中至少有1位采用1期付款”. 知A表示事件“购买该商品的3位顾客中无人采用1期付款”
P(A)=(1-0.4)2=0.216, P(A)=1-P(A)=1-0.216=0.784.
(Ⅱ)η的可能取值为200元,250元,300元.
P(η=200)=P(ξ=1)=0.4,
P(η=250)=P(ξ=2)+P(ξ=3)=0.2+0.2=0.4,
P(η=300)=1-P(η=200)-P(η=250)=1-0.4-0.4=0.2.
η的分布列为
Eη=200⨯0.4+250⨯0.4+300⨯0.2=240(元).
抽样方法与总体分布的估计 抽样方法
1.简单随机抽样:设一个总体的个数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.
2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).
3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样. 总体分布的估计
由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体的分布,一般地,样本容量越大,这种估计就越精确.
总体分布:总体取值的概率分布规律通常称为总体分布.
当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及相应的频率表示,几何表示就是相应的条形图.
当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布.
总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线. 典型例题
例1.某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2:3:5.现用分层抽样方法抽出一个容量为n的样本,样本中A种型号产品有16件.那么此样本的容量n= .
210
16⨯=80
2解答过程:A种型号的总体是10,则样本容量n=.
例2.一个总体中有100个个体,随机编号0,1,2,„,99,依编号顺序平均分成10个
小组,组号依次为1,2,3,„,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字
相同,若m=6,则在第7组中抽取的号码是 .
解答过程:第K组的号码为(k-1)10 ,(k-1)10+1,„,(k-1)10+9,当m=6时,第k组抽取的号的个位数字为m+k的个位数字,所以第7组中抽取的号码的个位数字为3 ,所以抽取号码为63.
正态分布与线性回归
1.正态分布的概念及主要性质
(1)正态分布的概念
f(x)=
12πσ
e
-(x-μ)22σ如果连续型随机变量ξ 的概率密度函数为 ,x∈R 其中σ、μ为常
2
数,并且σ>0,则称ξ服从正态分布,记为ξ~N(μ,σ).
2
Dξ=σξ(2)期望E =μ,方差.
(3)正态分布的性质
正态曲线具有下列性质:
①曲线在x轴上方,并且关于直线x=μ对称.
②曲线在x=μ时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低. ③曲线的对称轴位置由μ确定;曲线的形状由σ确定,σ越大,曲线越“矮胖”;反之越“高瘦”.
三σ原则即为
数值分布在(μ—σ,μ+σ)中的概率为0.6526 数值分布在(μ—2σ,μ+2σ)中的概率为0.9544 数值分布在(μ—3σ,μ+3σ)中的概率为0.9974 (4)标准正态分布
当μ=0,σ=1时ξ服从标准的正态分布,记作ξ~N(0,1) (5)两个重要的公式
①φ(-x)=1-φ(x),② P(a
2
(6)N(μ,σ)与N(0,1)二者联系.
若ξ~N(μ,σ),则
2
2
η=
ξ-μ
~N(0,1)σ ;
b-μ
②若ξ~N(μ,σ),则
P(a
σ
)-φ(
a-μ
σ
)
.
2.线性回归
简单的说,线性回归就是处理变量与变量之间的线性关系的一种数学方法.
变量和变量之间的关系大致可分为两种类型:确定性的函数关系和不确定的函数关系.不确定性的两个变量之间往往仍有规律可循.回归分析就是处理变量之间的相关关系的一种数量统计方法.它可以提供变量之间相关关系的经验公式.
具体说来,对n个样本数据(x1,y1),(x2,y2),„,(xn,yn),其回归直线方程,或经验公式
b=
∑xy
i
n
i
-,a=-b⋅,
2
ˆ=bx+a.其中为:y
∑x
i=1
i=1
n
2i
-n()
,其中,分别为|xi|、|yi|的平均数.
例1.如果随机变量ξ~N(μ,σ2),且Eξ=3,Dξ=1,则P(-1<ξ≤1=等于( ) A.2Φ(1)-1 B.Φ(4)-Φ(2)
C.Φ(2)-Φ(4) D.Φ(-4)-Φ(-2)
解答过程:对正态分布,μ=Eξ=3,σ2=Dξ=1,故P(-1<ξ≤1)=Φ(1-3)-Φ(-1-3)=Φ(-2)-Φ(-4)=Φ(4)-Φ(2). 答案:B
例2. 将温度调节器放置在贮存着某种液体的容器内,调节器设定在d ℃,液体的温度ξ(单位:℃)是一个随机变量,且ξ~N(d,0.52). (1)若d=90°,则ξ
89-90
(2)由已知d满足0.99≤P(ξ≥80),
即1-P(ξ
80-d
∴Φ(0.580-d∴0.5
)≤0.01=Φ(-2.327).
≤-2.327.
∴d≤81.1635.
故d至少为81.1635.
ξ-μ
小结:(1)若ξ~N(0,1),则η=σ~N(0,1).(2)标准正态分布的密度函数f(x)
是偶函数,x0时,f(x)为减函数.