概率论与数理统计导论第2章
第二章 随机变量及其概率分布
2.1 随机变量与离散型随机变量
随机试验的结果构成了样本空间,因此有些样本空间中的元素是用数字表示的,有些则不是,如果将样本空间中的每一元素唯一对应于一个实数,就得到了随机变量。
随机变量 设样本空间S 中的每个样本点e 单值对应实数X(e),称X(e)为随机变量,简记X 。通常,随机变量用X,Y,Z 等大写字母表示。 例2.1.1 若样本空间S 中有4个元素,S={a,b,c,d},(1)令X(a)=X(b)=1,X(c)=3,X(d)=9;(2)令Y(a)=1,Y(a)=2,Y(b)=3,Y(c)=4,Y(d)=5;(3)令Z(a)=Z(b)=Z(c)=3,Z(d)=1。问X ,Y ,Z 都是随机变量吗?
解:由随机变量的定义知,X 与Z 是随机变量,Y 不是随机变量。
{X=1}={a,b}, {X=3}={c}, {X=9}={d}是随机事件;{X=1},{X=3},{X=9}是样本空间的划分。
离散型随机变量 若随机变量X 的取值是有限或可列无穷的,称X 为离散型随机变量。
设随机变量X 的取值为x 1, , x n , ,P (X =x k ) =p k , k =1,2,... 称为随机变量X 的分布律或分布列,也可以用表格表示。
表2.1 离散型随机变量分布律表
分布律的性质:(1)p i ≥0,(2)∑p i =1。
i =1
∞
例2.1.2 掷一枚均匀硬币3次,观察出现正反面的情况,写出样本空间S ,将出现正面的次数记为X ,写出X 的分布律。
解:S={正正正,正正反,正反正,反正正,正反反,反正反,反反正,反反反},{X=0}={反反反},{X=1}={正反反,反正反,反反正},{X=2}={正正反,正反正,反正正},{X=3}={正正正};这8种情况是等可能出现的,所以X 的分布律为
表2.2 例2.1.2分布律表
例2.1.3 设随机变量X 的取值为1,2,3, P (X =k ) =ak , k =1,2,3,求(1)a 的值;(2)
P (X ≤2) 。
解:(1)1=
∑P (X =k ) =6a ,
k =1
3
⇒a =
1
; 6
(2)P (X ≤2) =P (X =1) +P (X =2) =1-P (X =3) =0.5;
例2.1.4 一盒中有3个红球2个白球,采用不放回抽样取3次,X 表示取到的红球数,求随机变量X 的分布律。
3-k
C 3k C 2
解: P (X =k ) =, k =1,2,3,即
3
C 5
表2.3 例2.1.4分布律表
下面介绍离散型随机变量几个常见的分布 (1)0-1分布
设随机变量X 只取0,1,P (X =k ) =p k (1-p ) 1-k , k =0,1. 称X 服从0-1分布,或伯努利分布,记为X ~B (1,p ) 。
若样本空间只有两个样本点,对应的随机变量可以用0-1分布描述;更一般地,设A 是一个随机事件,在进行一次试验时,可能A 发生,可能A 不发生,P(A)=p,设
⎧1, 若A 发生,
, p ) 。例如,检查产品的质量是否合格,对新生婴儿的,则X ~B (1X =⎨
⎩0, 若A 不发生.
性别进行登记,检验种子是否发芽,抛硬币是否出现正面等等都可以用(0-1)分布的随机变量来描述。
(2)二项分布
n 重伯努利试验:设随机试验只关心事件A 是否发生,P(A)=p, 0
以X 表示在n 重伯努利试验中A 发生的次数,则X 的分布律为
k k
P (X =k ) =C n p (1-p ) n -k , k =01,,⋅⋅⋅,n
称X 服从参数为n ,p 的二项分布,记为X ~B (n ,p ) 。
注: P (X =k ) 的值计算包含有:一是k 次A 发生n-k 次A 不发生的情况有多少种?可以
k
算出有C n 种,另一部分是每种情况的概率值是多少?因为每种情况都是k 次A 发生n-k 次
A 不发生,且试验是独立的,因此概率都是p (1-p )
k n -k
k k
,所以P (X =k ) =C n p (1-p ) n -k 。
例2.1.5 某人用一把没有校正的枪进行射击,设他的命中率为0.02,若他独立重复射击了200
次,求他至少命中一次的概率。
200
解:设X 表示他命中的次数,则X ~B (200,0.02),P (X ≥1) =1-0.98=0.982。
由于命中率只有0.02,根据实际推断原理,如果射击一次,几乎是不会命中的;但如果射击200次,则“一次都没命中”变成了小概率事件,因此可以推测射击200次,至少会有1次命中目标,这也告诉我们,不能轻视小概率事件。
例2.1.6 某批产品的数量很大,从中不放回取10件产品检验,若没有发现次品或仅发现1
件次品就接收该批产品,若发现2件次品,则从该批产品中另外再抽取6件产品检验,如果这6件产品中没有次品也接收该批产品,若10件产品中的次品数至少有3件,则拒收该批产品,设产品的次品率为0.1,求该批产品被接收的概率。
解:设第1,2次抽样检验的次品数分别记为X ,Y ,则X~B(10,0.1) ,Y~B(6,0.1) ;且事件{X=2}与{Y=0}相互独立,因此该批产品接收的概率为
p =P (X ≤1) +P (X =2) P (Y =0) =0.839。
(3)超几何分布
在N 件产品中有D 件次品,采用不放回抽样取n 件,X 表示取到的次品数,则X 的取
k n -k C D C N -D
值在0,1,2, …,n ,P (X =k ) =, k =0,1,2,... n , k ≤D , n -k ≤N -D ,称X 服从超n
C N
几何分布。
例2.1.4就是超几何分布的例子。 (4)几何分布
考虑进行独立重复试验,每次试验关心事件A 是否发生,如试验是“成功”或者“失败”,设P (A ) =p , 0
如果试验进行到A 或“成功”发生为止,则试验次数X 是随机变量,取值为1,2,3, …P (X =k ) =p (1-p ) k -1, k =1,2,3,... 称X 服从几何分布。
例2.1.7 一盒中有2个红球4个白球,(1)从中取一球,X 表示取到的红球数,求X 的分布律;(2)采用不放回抽样取3球,Y 表示取到的红球数,求Y 的分布律;(3)采用放回抽样取3球,Z 表示取到的红球数,求Z 的分布律;(4)采用放回抽样取球,直到取到红球为止,U 表示取球次数,求U 的分布律。 解:(1)X 服从0-1分布,P(X=1)=1/3,P(X=0)=2/3;
k 3-k
C 2C 4
(2)Y 服从超几何分布,P (Y =k ) =, k =0,1,2; 3
C 6
23-k
, k =0,1,2,3; (3)Z 服从二项分布B(3, 1/3),P (Z =k ) =C 33
k 3
2k -1
(4)U 服从几何分布,P (U =k ) =k , k =1, 2,3,... 。
3
(5)泊松分布
若随机变量X 的概率分布律为
P (X =k ) =
λk e -λ
k !
, k =0,1,2, ⋅⋅⋅, λ>0
称X 服从参数为λ的泊松分布,记为X ~π(λ) 。
注:
∑P (X =k ) =e ∑k ! =e λ⨯e λ=1。
-λ
-
k =0
k =0
∞∞
λk
实际中,单位时间进商场的人数,使用ATM 机的人数,经过某路口的汽车数,收到的邮件数、短信数等等都可以用泊松分布描述。
例2.1.8 设某汽车停靠站单位时间内候车人数X ~π(4.5), (1)随机观察1个单位时间,求至少有3人候车的概率; (2)随机独立观察5个单位时间,求恰有4个单位时间至少有3人候车的概率。
解:(1) P (X ≥3) =1-P (X =0) -P (X =1) -P (X =2)
=1-e
-4.5
4.52
(1+4.5+) =0.8264;
2!
(2)设5个单位时间内有Y 个单位时间是“至少有3人候车”,则Y~B(5,p) ,其中p=0.8264,
44于是,所求概率为P (Y =4) =C 5p (1-p ) =0.405。
2.2 分布函数与连续型随机变量
对于离散型随机变量,它的取值可以一一列出,但是还有其他的随机变量,取值无法一一列出,描述这些随机变量的分布就需要用其他方法,下面我们给出的分布函数适用于描述所有随机变量的分布。
分布函数定义 对于任意实数x ,F (x ) =P (X ≤x ) 称为随机变量X 的分布函数。 分布函数的性质:(1)0≤F (x ) ≤1;
F (-∞) =lim F (x ) =0,F (+∞) =lim F (x ) =1;(2)当x 1
x →-∞
x →+∞
F (x +ε) =F (x ) 。 (3)分布函数右连续,即F (x +0) =lim +
ε→0
例2.2.1 接例2.1.3随机变量X 的取值为1,2,3, P (X =k ) =k /6, k =1,2,3,求X 的分布函数。 解:P (X =1) =
123
, P (X =2) =, P (X =3) =; 666
当x
1
当1≤x
6当2≤x
123+=, 666
当3≤x 时,F (x ) =P (X ≤x ) =P (X =1) +P (X =2) +P (X =3) =1.
于是有
x
⎪, 1≤x
(3)F (x ) =P (X ≤x ) =⎨6。
⎪2, 2≤x
图2.1 例2.2.1的分布律(左)与分布函数(右)示意图
可以看到,离散型随机变量的分布函数是阶梯型上升的,跳跃点是概率大于0的点,跳跃高度是该点的概率值。一般地,若X 的分布律为P (X =x k ) =p k , k =1,2,... ,则X 的分布函数F (x ) =
x k ≤x
∑p
k
。描述离散型随机变量的分布律只需要将它的取值以及取值的概率表
示出来就可以了,但分布函数要求对于一切实数x ,计算P (X ≤x ) 的值,它是一个累积值。 例2.2.2 一小球在区间[0, 2]之间滚动,记它所处的位置为X ,设
P (0≤X ≤x ) =k x ,
解:F (x ) =0,
0
x
1=P (0≤X ≤2) =2k , ⇒k =0.5,所以
x
⎪
F (x ) =P (X ≤x ) =P (X
⎪1, x ≥2. ⎩
图2.2 例2.2.2中X 的分布函数示意图
从图2.2中可以看出,例2.2.2中的分布函数是连续函数,它可以写成
F (x ) =⎰
x
-∞
⎧0.5, 0
f (t ) dt ,其中f (x ) =⎨。这就有下面的
0, 其他. ⎩
连续型随机变量定义 对于随机变量X 的分布函数F(x),若存在非负的函数f(x),使得对于任意实数x ,有:F (x ) =
⎰
x
-∞
f (t ) dt
称X 为连续型随机变量,其中f(x)称为X 的概率密度函数,简称概率密度。 概率密度性质:(1)f (x ) ≥0;(2)
⎰
+∞
-∞
(3)在f(x)的连续点x ,F '(x ) =f (x ) ;f (x ) dx =1;
(4)对于任意实数x 1, x 2(x 1
⎰
x 2
x 1
f (t ) dt ;
从而可以得到,对于任意实数a , P (X =a ) =0,因此X 落入区间的概率与区间是开或闭无关。还可以得到
P {x
)
1
2
图2.3 左图为概率密度性质(1)(2)示意图,中图是(x 1, x 2) 概率值示意图,右图是
(x , x +∆x ) 概率值示意图
⎧cx , 0
0, 其他. ⎩
数F(x);(3)P (X >0.5) 。
解:(1)1=
⎰
∞
-∞
⎧2x , 0
; f (x ) dx =c ⎰xdx =c /2, ⇒c =2,f (x ) =⎨
00, 其他. ⎩
1
(2)F (x ) =
⎰
x
-∞
⎧0, x
f (t ) dt =⎨x 2, 0≤x
⎪1, x ≥1. ⎩
(3)P (X >0.5) =1-F (0.5)=0.75。
对于许多初学者来说,不容易搞清楚的有两点:(1)是不能很好理解概率密度的含义,事实上概率密度用于描述连续型随机变量的作用相当于分布律用于描述离散型随机变量,某段概率密度大说明落入这段的可能性大,只是它不能用“点”来表示而要用“段”来表示。(2)是分布函数与密度函数的关系,在F (x ) =
⎰
x
-∞
f (t ) dt 中,积分下限是“-∞”,上限是“x ”,
⎧x , 0
⎪
你注意到了吗?如果随机变量X 的概率密度为f (x ) =⎨0.5, 1
⎪0, 其他. ⎩
吗?答案是F (x ) =
⎰
x
-∞
x
⎪2
⎪x , 0≤x
f (t ) dt =⎨2
⎪x , 1≤x
下面介绍常见的连续型随机变量的分布:
(1)均匀分布
⎧1
, a
若随机变量X 的概率密度为f (x ) =⎨b -a ,称X 在区间(a,b)上服从均匀
⎪⎩0, 其他.
⎧0, x
⎪x -a ⎪
分布,记为X ~U(a,b)。其分布函数为F (x ) =⎨, a ≤x
⎪b -a ⎪⎩1, x ≥b .
图2.4 均匀分布的概率密度和分布函数示意图
均匀分布性质:设区间(c , c +l ) 是(a,b)的子区间,即a ≤c
P (c
c +l
c
1l
dt = , b -a b -a
这说明随机变量落在子区间的概率只与子区间的长度l 成正比,与位置c 无关。
例2.2.2就是区间[0,2]上均匀分布的例子。
例2.2.4 一车站开往某地的班车从6:00-18:00,每隔20分钟发出一趟,小李到达车站的时间在7:20-8:10间均匀分布,求他等车时间不到10分钟的概率。
解:等车时间不到10分钟,指他的到达时间在7:30-7:40和7:50-8:00,根据均匀分布的性质得,概率值p=20/50=0.4。 (2)指数分布
⎧λe -λx , x >0,
若随机变量X 的概率密度为f (x ) =⎨
⎩0, x ≤0.
其中λ>0为常数,则称X 服从参数为λ的指数分布。记为X ~Exp (λ) 或X ~E (λ) 。
⎧1-e -λx , x >0.
指数分布的分布函数为F (x ) =⎨。
⎩0, x ≤0.
指数分布常用于描述产品的寿命。
指数分布的性质:设实数t 0>0, t >0,则有
P (X >t 0+t |X >t 0) =
P (X >t 0+t ) 1-F (t 0+t )
==e -λt =P (X >t ) ,
P (X >t 0) 1-F (t 0)
这一性质称为无记忆性,即如果某种产品的寿命X (单位:年)服从参数为λ的指数分布,在已知该产品使用t 0年后,再继续使用t 年以上的概率,等于它是新的使用t 年以上的概率。
例2.2.5 设某人电话通话时间X (分钟)服从指数分布,概率密度为
x
⎧1-15
⎪e , x >0,
求(1)通话时间在10~20分钟之间的概率;(2)通话时间超过f (x ) =⎨15
⎪0, x ≤0. ⎩
20分钟的概率; (3)若她已经打了10分钟,求她总共通话时间超过20分钟的概率。
解:(1)P (10
∞
20
10
24x
--1-15
e dx =e 3-e 3=0.250; 15
x 4
-1-15
e dx =e 3=0.264; (2)P (X >20) =⎰2015
x 2
-1-15
e dx =e 3=0.513. (3)根据无记忆性,P (X >20X >10) =P (X >10) =⎰1015
∞
(3)正态分布
若随机变量X 的概率密度
为f (x ) =
-
(x -μ) 22σ2
, -∞
2
参数-∞0,称X 服从正态分布(也称为高斯分布) ,记为X ~N (μ, σ) 。
中图σ相同μ不同的密度函数图,右图σ不同μ相同的密度函数图
概率密度f(x)的特征:(1)关于x =μ对称;(2
)最大值为f (μ) =
;(3)x →±∞
lim f (x ) =0。
-(x -μ) 22σ
2
验证
⎰
∞
-∞
f (x ) dx =⎰
2
∞
t =
x -μ
dx =
σ
⎰
2π
∞
-t 2?
dt =1。 ∞
-r 22
2
x ⎛∞-t ⎫∞∞-
事实上, ⎰e 2dt ⎪=⎰⎰e
-∞-∞ -∞⎪
⎝⎭
2
2
+y 2
2
dxdy =⎰d θ⎰re
dr =2π,即得证。
2
-x 2
特别地,X~N(0, 1)称为标准正态分布,
其概率密度ϕ(x ) =, -∞
函数为Φ(x ) =
⎰
x
-t 2
dt 。显然, 2
Φ(-x ) =1-Φ(x ) ,具体的值可以通过查附表2得到。
公式:若X ~N (μ, σ) ,则F (x ) =Φ(
x
2
x -μ
σ
σ
) 。
事实上,F (x ) =
⎰
-
(t -μ) 22σu =
t -μ
x -μ
dt =
⎰
σ
-∞
-
u 22
du =Φ(
x -μ
σ
) 。
计算得,P (X -μ
=Φ(1)-Φ(-1) =2Φ(1)-1=0.6826,
P (X -μ
即X 落入以μ为中心,3σ范围内的概率达到99.74%,通常称为“3σ规则”。 例2.2.6 设随机变量X 的概率密度为f (x ) =ce -x , -∞1)。 解:首先要认识这是正态分布的概率密度,对比后可得μ=0, σ=
2
2
1
,因此 2
(1
)c =
;(2
)P (X >1) =1-Φ∞
=1-Φ=0.7611。 本题中的常数不宜用
⎰
-∞
f (x ) dx =1求得。
例2.2.7 设X ~N (1,4),P (X >2) =a , P (X 2) =1-P (X ≤2) =1-Φ(
2-1
) =1-Φ(0.5)=1-0.6915=0.3085,所以,2
b -1b -1
a =0.3085;而P (X
22
注:若X~N(0,1),则记号z α表示P (X >z α) =α,即Φ(z α) =1-α, z 0.025=1.96。 例2.2.8. 设某群体的体质指标BMI 值X ~N (22.5,2.52) (单位:kg /m 2),医学研究发现身体肥胖者患高血压可能性增大,设X ≤25时,患高血压概率为10%,25
患高血压概率为15%,X>27.5时,患高血压的概率为30%,现从该群体中随机选出1人,求他患高血压的概率。 解:设A 表示选中的人得高血压,则他的体重可能是{X≤25},{2527.5},应用全概率公式,
P (A ) =P (X ≤25) P (A X ≤25) +P (2527.5) P (A X >27.5)
=0.1⨯Φ(1)+0.15⨯(Φ(2)-Φ(1))+0.3⨯(1-Φ(2))=0.111
正态分布是概率统计中及其重要的一个分布,应用非常广泛,其理论基础就是中心极限定理,粗略地说,如果一个量是许多独立随机变量的总和,在一定条件下,这个总和近似服从正态分布。正态分布可以描述很多不同的现象,如测量误差,人的身高,气体分子的速度等等。
2.3 二元离散型随机变量
如果将样本空间S 的元素e 单值对应于二元点(X(e ), Y(e ) ),简记(X ,Y ),称为二元随机变量。如果(X ,Y )的取值只有有限对或可列无限对,称(X ,Y )为离散型随机变量。设(X ,Y )的取值为(x i , y j ), i , j =1,2,3,... ,以{X =x i Y 表示, =y j }
{X =x i }⋂Y {=y j ,称}P (X =x i , Y =y j ) =p ij , i , j =1,2,3,... 为(X ,Y )的分布律。可
以用表格表示:
表2.4 (X,Y )概率分布律表
分布律的性质:(1)p ij ≥0, i , j =1,2,3,... ;(2)
∑∑p
j =1i =1
∞∞
ij
=1。
例2.3.1 将一枚均匀的骰子掷两次,X 表示第一次出现的点数,Y 表示第二次出现的点数,Z 表示两次点数的最大值。(1)分别求X,Y 和Z 的分布律;(2)求(X ,Y )和(X ,Z )的分布律。
解:(1)容易得,X 与Y 的分布律相同,P(X=i)=1/6, i=1,2,3,4,5,6,P(Y=i)=1/6, i=1,2,3,4,5,6,
表2.5 例2.3.1中Z 的分布律表
(2)注意到,{X=i}与{Y=j }相互独立,对一切的i,j=1,…,6,所以P(X=i, Y=j)=P(X=i)P(Y=j),(X, Y)
表2.6 (X, Y)的联合分布律表 为计算(X, Z)的联合分布律,分析如下:
1,36i
当i =j 时, P (X =i , Z =j ) =P (X =i , Y ≤i ) =,
36
当i >j 时, P (X =i , Z =j ) =0。
当i
所以,(X, Z)的联合分布律为
表2.7 (X, Z)的联合分布律
若(X ,Y )的分布律为P (X =x i , Y =y j ) =p ij , i , j =1,2,3,... ,则
P (X =x i ) =P (X =x i , Y
j =1
j =1
∞∞
P (Y =y j ) =P (X
i =1
i =1
∞∞
X,Y 的边际分布律或边缘分布律。注意它们在表格中的位置,就是名称“边际”或“边缘”
例2.3.2 在例2.3.1中通过(X,Y )和(X,Z )联合分布律,计算X ,Y ,Z 的边际分布律,并将它们与直接计算的结果比较,是否一致?
解:容易计算,并发现结果完全一致。即边际分布律可以直接计算也可以通过联合分布律得到。
设(X ,Y )的联合分布律为P (X =x i , Y =y j ) =p ij , i , j =1,2,3,... ,若已知{X =x i },则Y 的分布律P (Y =y j X =x i ) =
p ij p i ∙
Y 的条件分布律,同理,, j =1,2,... 称为当{X =x i }时,
当{Y =y j }时,X 的条件分布律为P (X =x i Y =y j ) =
p ij p ∙j
, i =1,2,...
例2.3.3 一盒中有3个黑球,2个红球,2个白球,采用不放回抽样取2球,X 表示取到的
黑球数,Y 表示取到的红球数。(1)求(X,Y )的分布律,(
2)分别求X 与Y 的边际分布律,(3)求X=0时Y 的条件分布律。如果将抽样方式改为放回抽样,上述分布律又如何?
表2.10 不放回抽样情形X=0条件下Y 的条件分布律表
放回抽样,
2.4 二元连续型随机变量
为了给出二元连续型随机变量,我们先来介绍二元随机变量的分布函数。
二元随机变量的分布函数 设(X,Y)是二元随机变量,对于任意实数对(x , y ) ,将
F (x , y ) =P ({X ≤x }⋂{Y ≤y })=P (X ≤x , Y ≤y ) 称为二元随机变量(X,Y)的分布函数。
分布函数的性质:(1)0≤F (x , y ) ≤1,给定y ,当x 1
(2)给定x,y ,F (x , -∞) =F (-∞, y ) =F (-∞, -∞) =0,F (+∞, +∞) =1;
记为
(
+0, y ) (3
)右连续性,对于(x,y ),Fx
(4)设x 1
Fxy =(,
0) +(,Fxy =)
;
F (x 2, y 2) -F (x 1, y 2) -F (x 2, y 1) +F (x 1, y 1) =P (x 1
图2.8 左图F(x,y)示意图,中图性质(1)示意图,右图性质(4)示意图
若二元随机变量(X,Y)的联合分布函数为F(x,y),将X ,Y 的边际分布函数分别记为
F X (x ), F Y (y ) ,可以得到:
F X (x ) =P (X ≤x ) =P (X ≤x , Y
下面我们给出二元连续型随机变量的定义。
设(X,Y)是二元随机变量,分布函数为F(x,y),若存在二元非负函数f(x,y),使得
F (x , y ) =⎰
x
-∞-∞
⎰
y
f (u , v ) dudv ,称(X,Y)是二元连续型随机变量,f(x,y)称为(X,Y)的概率密
度函数,或概率密度。图2.9是概率密度(左)和相应的分布函数(右)示意图。
概率密度f(x,y)几何意义是在XOY 平面上方的曲面,与XOY 平面围成的体积为1;落在平面上区域D 的概率是以D 为底,以f(x,y)为顶的柱体体积。分布函数F(x,y)表示以{X ≤x,Y ≤y}为底,f(x,y)为顶的柱体体积。
如果随机变量(X,Y)的密度函数在有界区域D 内取值为常数,在D 外取值为0,即
⎧(D 的面积) -1, (x , y ) ∈D
,称(X,Y)服从二元均匀分布。 f (x , y ) =⎨
(x , y ) ∉D ⎩0,
此时,若G ⊂D ,则P {(x , y ) ∈G }=
⎰⎰
G
f (x , y ) dxdy =
G 的面积
。
D 的面积
例2.4.1设随机变量(X,Y)在区域D ={(x , y ) :0
从图中看出区域的面积为1,所以概率密度为
图
⎧1, 0
f (x , y ) =⎨
0, 其他. ⎩
(2){x
(3){x
从图中看出区域的面积为0.5,所以概率密度为
图
⎧2, 0
f (x , y ) =⎨
其他. ⎩0,
(2){x+y
(3){x
设随机变量(X,Y)的概率密度为f(x,y),则X,Y 的边际概率密度为
f X (x ) =⎰
∞
-∞
f (x , y ) dy ,f Y (y ) =⎰
∞
-∞
f (x , y ) dx ;
x -∞
事实上F X (x ) =F (x , ∞) =可以将f X (x ) =
∞
⎰
x
-∞
(⎰
∞
-∞
f (t , y ) dy ) dt =⎰f X (t ) dt 。
⎰
∞
-∞
f (x , y ) dy 与离散型随机变量的边际分布律
∞
P (X =x i ) =∑P (X =x i , Y =y j ) =∑p ij , i =1,2,... 进行对照,找出相同点。
j =1
j =1
边际概率密度f X (x 0) =成的面积
⎰
∞
-∞
f (x 0, y ) dy 的几何意义是在x 0点的曲线z =f (x 0, y ) 与Y 轴围
∞-∞
⎰
∞
-∞
f (x 0, y ) dy ,从而体积1=⎰f X (x 0) dx 0=⎰(⎰
-∞
∞∞
-∞
f (x 0, y ) dy ) dx 0。
例2.4.3 接例2.4.1设 (X,Y)的概率密度为f (x , y ) =⎨的边际概率密度f X (x ) 和f Y (y ) 。
解: 根据公式f X (x ) =
⎧1, 0
与Y
0, ⎩
⎰
∞
-∞
f (x , y ) dy 得 图2.12 例2.4.3密度函数区域图
1
⎧∞
f X (x ) =⎰ f (x , y ) d =y ⎨-∞
⎪其他. ⎩0,
1⎧∞⎪dx =1, 0
同理,f Y (y ) =⎰f (x , y ) dx =⎨⎰0。
-∞
⎪0, 其他. ⎩
例2.4.4 接例2.4.2设随机变量(X,Y) 的概率密度为f (x , y ) =⎨Y 的边际概率密度f X (x ) 和f Y (y ) 。
解:根据公式f X (x ) =
⎧2, 0
分别求X 与
其他. ⎩0,
⎰
∞
-∞
f (x , y ) dy 得
图2.13 例2.4.4密度函数区域图
1
⎧-x ) ,
f X (x ) =⎰ f (x , y ) d =y ⎨-∞
⎪0, 其他. ⎩
y ⎧∞⎪2dx =2y , 0
同理,f Y (y ) =⎰f (x , y ) dx =⎨⎰0。
-∞
⎪0, 其他. ⎩
∞
设(X,Y)的联合概率密度为f(x,y), X 与Y 的边际概率密度分别为f X (x ) 和f Y (y ) ,若在Y=y点,f Y (y ) 连续,且取值大于0,则在Y=y条件下X 的条件概率密度为f X (x y ) =
f (x , y )
;f Y (y )
同理在X=x点,f X (x ) 连续,且取值大于0,则在X=x条件下Y 的条件概率密度为
f Y X (y x ) =
f (x , y )
。 f X (x )
⎧1, 0
例2.4.5 接例2.4.3设 (X,Y)的概率密度为f (x , y ) =⎨,分别求X=x条
0, 其他. ⎩
件下Y 的条件概率密度f Y X (y x ) 与Y=y条件下X 的条件概率密度f X (x y ) 。 解: 由例2.4.3,X 与Y 的边际概率密度分别为
f X (x ) =⎨ , f Y y (=) ⎨
0, 其他. 0, 其他. ⎩⎩
所以当0
f (x , y ) ⎧1, 0
与x 的取值无关, =⎨
其他. f X (x ) ⎩0,
f (x , y ) ⎧1, 0
当0
其他. f Y (y ) ⎩0,
例2.4.6 接例2.4.4设随机变量(X,Y) 的概率密度为f (x , y ) =⎨
⎧2, 0
,分别求
X=x
其他. ⎩0,
条件下Y 的条件概率密度f Y X (y x ) 与Y=y条件下X 的条件概率密度f X (x y ) 。 解:由例2.4.4,X 与Y 的边际概率密度分别为 f X (x ) =⎨
-x ) ,
其他. ⎩0, 1, , y 0
, f Y y (=) ⎨
⎩0, 其他.
f (x , y ) ⎧(1-x ) -1, x
所以当0
f X (x ) ⎩0, 其他. f (x , y ) ⎧y -1, 0
当0
f Y (y ) ⎩0, 其他.
注意:这两个条件分布都是均匀分布。
例2.4.7 设随机变量(X,Y)的概率密度f (x , y ) =⎨
⎧3x ,0
求(1)X,Y的边际概率密
其他. ⎩0,
度f X (x ) ,f Y (y ) ;(2)条件概率密度f X (x y ) ,并计算P (X ≤0.7=0.5) 。 解: (1)f X (x ) =
⎰
∞
-∞
x
2⎧⎪⎰03xdy =3x ,0
f (x , y ) dy =⎨
⎪0, 其他. ⎩
f Y (y ) =⎰
∞
-∞
⎧13(1-y 2)
,0
f (x , y ) dx =⎨⎰y 2
⎪0, 其他. ⎩
⎧2x
, y
1-y (2)0
f Y (y ) ⎪
其他. ⎩0,
⎧8x 0.78x ⎪,0.5
dx =0.32. ,P (X ≤0.7Y =0.5) =⎰当y =0.5时, f X (x 0.5) =⎨3
0.53
⎪其他. ⎩0,
二元正态分布
设随机变量(X,Y)的概率密度为
f (x , y ) =
(x -μ1) 2(x -μ1) (y -μ2) (y -μ2) 2-1
[-2ρ+]} 2222(1-ρ) σ1σ1σ2σ2其中,-∞0, -1
2
(X , Y ) ~N (μ1, μ2, σ12, σ2, ρ) ,下图2.14-2.17给出二元正态分布概率密度的图形。
解:f X (x ) =⎰
∞
-∞
f (x , y ) dy
-(x -μ1) 2
exp[]
∞2σ2(x -μ1) 2-1
=[y -(μ+ρ)]}dy 2222(1-ρ) σ2σ1-(x -μ1) 2exp[]
2
=-∞
2
同理可得Y ~N (μ2, σ2) ,即正态分布的边际分布仍是正态分布。
2.5 随机变量的独立性
设(X,Y)的分布函数为F(x,y),若对于任意实数(x,y),F (x , y ) =F X (x ) F Y (y ) ,即
P (X ≤x , Y ≤y ) =P (X ≤) x P (Y ≤,称) y 随机变量X 与Y 相互独立。
对于离散型随机变量随机变量X 与Y 的联合分布律为P (X =x i , Y =y j ), i , j =1,2,... ,则X 与Y 相互独立等价于对于i , j =1, 2,... ,P (X =x i , Y =y j ) =P (X =x i ) P (Y =y j ) ,即
p ij =p i ∙p ∙j 。
若连续型随机变量(X,Y)的概率密度为f(x,y),X 与Y 的边际概率密度分别为f X (x ), f Y (y ) ,则X 与Y 相互独立等价于f (x , y ) =f X (x ) f Y (y ) 几乎处处成立。
例2.3.1中的X 与Y 是独立的,而X 与Z 是不独立的;例2.3.2中不放回抽样时,X 与Y 是不独立的,放回抽样时,X 与Y 是独立的。
例2.4.1中的X 与Y 是独立的,例2.4.2中的X 与Y 是不独立的。独立随机变量的边际分布与条件分布相同。
例2.5.1 设随机变量(X ,Y )的联合分布律为
已知X 与Y 相互独立,(1)求a,b,c,d,e 的值;(2)在Y =-1的条件下,求X 的条件分布律。
解:(1)由题知P(Y=-1)=0.4,P(X=2,Y=-1)=P(X=2)P(Y=-1),所以P(X=2)=0.5,同理得P(X=0)=0.25,P(X=1)=0.25,于是,e=0.2,再由P(X=2,Y=0)=P(X=2)P(Y=0),P(X=2,Y=1)=P(X=2)P(Y=1),得到P(Y=0)=0.4,P(Y=1)=0.2,所以,a=c=0.1,b=d=0.05;
表2.15 例2.5.1联合分布律与边际分布律表
(2)因为X 与Y 独立,所以,在Y=-1条件下X 的条件分布律与X 的边际分布律相同,见表2.15。
2
例2.5.2设随机变量(X , Y ) ~N (μ1, μ2, σ12, σ2, ρ) ,证明X 与Y 相互独立的充分必要条件
是ρ=0。
证明:若ρ=0,显然有f (x , y ) =f X (x ) f Y (y ) ,对于一切的(x , y ) 成立,从而X 与Y 相互独立;反之,由于f (x , y ) 是连续函数,所以X 与Y 相互独立等价于对于一切的(x , y ) ,
f (x ,
y ) =f X
(x
) f Y (y ) ,特别地有f (μ1, μ2) =f X (μ1) f Y (μ2) ,即
=
ρ=0,得证。 2.6 随机变量函数的分布
实际中经常会碰到已知随机变量X 的分布,Y=g(X),问Y 的分布,或者已知(X,Y)的分布,
Z=h(X,Y),问Z 的分布。这就是随机变量函数的分布,解决这一问题的方法具有普遍性,可以通过下面的例子来了解。
例2.6.1 已知随机变量X 的分布律如下表所示,Y =X ,求Y 的分布律
2
解:Y 的取值为0,1,4,{Y=0}={X=0},{Y=1}={X=-1}∪{X=1},{Y=4}={X=2},所以 P(Y=0)=0.3,P(Y=1)=0.3,P(Y=4)=0.4。 即
Y 的分布律为例2.6.2 设随机变量X 的概率密度为f X (x ) =⎨
⎧2x , 0
, Y
=X ,求Y 的概率密度
其他. ⎩0,
f Y (y
) 。
解:F Y (
y ) =P (Y ≤y ) =P (X ≤y ) ,所以当y
2
当0≤y
所以f Y (y ) =⎨
⎧1, 0
。 其他. ⎩0,
通过这两个例子,可以看到,首先要确定随机变量Y 是离散型随机变量还是连续型随机变量,如果是离散型随机变量,确定Y 的取值,找到等价事件,即{Y =y }={X ∈D };如果是连续型随机变量,求Y 的分布函数,找到等价事件,即{Y ≤y }={X ∈D }。
下面给出一些特殊函数的公式,注意只有符合条件才能用,条件不适合时用可能会出错的。
而这些公式的推导用的是同一种方法。
公式一 设随机变量X 的概率密度为f X (x ) ,y =g (x ) ,连续可导,且y '=g '(x ) >0,
(或
的反函数。
证明:F Y (y ) =P (Y ≤y ) =P (g (X ) ≤y ) =P (X ≤h (y )) =F X (h (y )) 求导得,f Y (y ) =h '(y ) f X (h (y )) =h '(y ) f X (h (y )) 。
公式二 设随机变量(X,Y)的概率密度为f(x,y),Z=X+Y,则Z 的概率密度为
f Z (z ) =⎰
∞
-∞
f (x , z -x ) dx ,特别当X 与Y 独立时,f Z (z ) =⎰f X (x ) f Y (z -x ) dx ,称为
-∞
∞
卷积公式。根据对称性,f Z (z ) =
⎰
∞
-∞
f (z -y , y ) dy 。
证明:F Z (z ) =P (Z ≤z ) =P (X +Y ≤z ) =
u =x +y
⎰
∞
-∞
dx ⎰
z -x
-∞
f (x , y ) dy
=
⎰
∞
-∞
dx ⎰f (x , u -x ) du =⎰[⎰f (x , u -x ) dx ]du
-∞
-∞
-∞
z z ∞
求导得f Z (z ) =
⎰
∞
-∞
f (x , z -x ) dx 。
公式三 设随机变量X 与Y 相互独立,分布函数分别为为F X (x ), F Y (y ) ,令
M =max(X , Y ) ,N =min(X , Y ) ,则M 与N 的分布函数分别为
F M (z ) =F X (z ) F Y (z ) ,F N (z ) =1-(1-F X (z ))(1-F Y (z )) ;
若X 与Y 相互独立同分布,记F X (z ) =F Y (z ) =F (z ) ,
F M (z ) =F 2(z ), F N (z ) =1-(1-F (z )) 2。
如果随机变量X 1, , X n 相互独立同分布,分布函数为F (x ) ,M =max X i ,
1≤i ≤n
N =min X i
1≤i ≤n
则F M (z ) =F (z ),
n
F N (z ) =1-(1-F (z )) n 。
证明:
F M (z ) =P (max(X , Y ) ≤z ) =P (X ≤z , Y ≤z ) =P (X ≤z ) P (Y ≤z ) =F X (z ) F Y (z )
;
F N (z ) =P (min(X , Y ) ≤z ) =1-P (min(X , Y ) >z ) =1-P (X >z , Y >z ) =1-P (X >z ) P (Y >z ) =1-(1-F X (z ))(1-F Y (z ))
例2.6.3 设随机变量X ~N (μ, σ2) ,Y =aX +b , a ≠0,证明Y ~N (a μ+b , a 2σ2) 。
证明:X
的概率密度为f X (x ) =
(
-
(x -μ) 22σ, -∞
y -b
,由公式一,
a
f Y (y ) =
1y -b f X () =a a y -b
-μ) 2-
2σ2
=
-
(y -(a μ+b )) 2
2a 2σ2
, -∞
Y ~N (a μ+b , a 2σ2) 。
例2.6.4 设随机变量(X , Y ) ~N (0,0,1,1,ρ) ,Z=X+Y,求Z 的概率密度f Z (z ) 。
-(x 2-2ρxy +y 2) ,由公式二,
解:f (x , y ) =22(1-ρ) f Z (z ) =⎰
∞
∞
-∞
f (x , z -x ) dx
-[x 2-2ρx (z -x ) +(z -x ) 2)
=⎰dx 22(1-ρ) ==
-z 24(1+ρ)
⎰
∞
-(x -z 2) 2
dx
(1-ρ) ,
-z 2
4(1+ρ)
即Z ~N (0,2+2ρ) 。
将例2.6.3和例2.6.4结合起来可以得到,一般地,若(X , Y ) ~N (μ1, μ2, σ1, σ2, ρ) ,
22
Z =aX +bY +c ,则Z ~N (a μ1+b μ2+c , a σb σ22+a 2b ρσ1σ2) 。即正态分布随机1+
2
2
变量的线性函数依然服从正态分布。
例2.5.6 设两元件的寿命X 与Y 相互独立,服从指数分布,概率密度分别为
⎧αe -αx , x >0, ⎧αe -αy , y >0,
,现将元件按下列三种方式连接,(1)串联,f X (x ) =⎨f Y (y ) =⎨
⎩0, 其他. ⎩0, 其他.
(2)并联,(3)备用(一个先工作,中间用开关并联,若元件损坏,开关自动合上,另一个元件开始工作),求系统寿命的概率密度。
图2.14 两个元件的三种连接方式:串联(左),并联(中),备用(右) 解:设系统的寿命为Z 。(1)串联系统,Z =min(X , Y ) ,
12
⎧1-e -(α+β) z , z >0,
F Z (z ) =1-(1-F X (z ))(1-F Y (z )) =⎨
z ≤0. ⎩0, ⎧(α+β) e -(α+β) z , z >0,
f Z (z ) =⎨
z ≤0. ⎩0,
(2)并联系统,Z =max(X , Y ) ,
⎧(1-e -αz )(1-e -βz ), z >0,
F Z (z ) =F X (z ) F Y (z ) =⎨
0, z ≤0. ⎩⎧αe -αz +βe -βz -(α+β) e -(α+β) z , z >0,
f Z (z ) =⎨
0, z ≤0. ⎩
(3)备用系统,Z =X +Y ,
z
-αx -β(z -x ) ⎧dx , z >0, ⎪⎰0αβe e
f X (x ) f Y (z -x ) dx =⎨
⎪0, z ≤0. ⎩
f Z (z ) =⎰
∞
-∞
⎧α2ze -αz , z >0,
若α=β,则f Z (z ) =⎨,
z ≤0. ⎩0, ⎧αβ
(e -αz -e -βz ), z >0, ⎪
若α≠β,则f Z (z ) =⎨β-α。
⎪0, z ≤0. ⎩
习题二
2.1设随机变量X 取值为1,2,3,4,P(X=i)=c(5-i),i=1,2,3,4,求常数c 的值。
2.2 从编号为1,2,3,4的四个球中,采用不放回抽样取2次球,每次取1个,X 表示取到的两个球中小的号码,求X 的分布律。
2.3将一枚骰子掷3次,X 表示“出现点数大于4”的次数,求X 的分布律。
2.4 一盒子有2个红球3个白球,采用放回抽样,每次取1个,取到红球就停止抽样,或者抽到3次停止抽样,X 表示抽样次数,求X 的分布律及P(X
2.5向一个目标独立射击,每次击中目标的概率均为p ,射击进行到击中目标为止,X 表示射击的次数,求X 的分布律。
2.6袋中有10个球,编号0,1,…,9,(1)采用不放回抽样取3次,每次取1球,X 表示取到号码大于6的个数,求X 的分布律;(2)采用放回抽样取3次,每次取1球,Y 表示取到的号码为偶数的个数,求Y 的分布律;(3)采用放回抽样取球,直到取到号码9为止,Z 表示取球次数,求Z 的分布律.
2.7 设银行ATM 机在单位时间服务的顾客数服从参数为1的泊松分布,(1)求单位时间至少有2个顾客接受服务的概率;(2)若已知单位时间至少有2个顾客接受服务,求至多有3个顾客接受服务的概率。
2.8 设随机变量X 服从参数为λ的泊松分布,已知P(X=1)=P(X=2),求λ的值。 2.9设随机变量X 的分布律为P (X =1) =数。
111
, P (X =2) =, P (X =4) =. 求X 的分布函623
⎧0, x
⎪, 1≤x
2.10设随机变量X 的分布函数为F (x ) =⎨,求X 的分布律。
⎪2, 2≤x
⎪1, x ≥5. ⎩
⎧c (2-x ), 0
2.11 设随机变量X 的概率密度为f (x ) =⎨(1)求常数c ;(2)求X 的
0, 其他. ⎩
分布函数F(x);(3)求P(X ≤1︱X>0.5)的值。
⎧0, x
2.12 设连续型随机变量X 的分布函数为F (x ) =⎨(1)求常数a,b ;(2)求X
⎪bx ,1≤x
的概率密度f(x);(3)求P(0.5
2.13 在区间(1,3)内随机取一数X ,写出X 的概率密度;若在该区间随机独立地取3个数,求至少有2个大于2的概率。
⎧0.2e -0.2x , x >0,
2.14 某种产品的寿命X 年服从指数分布,概率密度为f (x ) =⎨(1)求
⎩0, 其他.
P(X>5);(2)P(X ≤10∣X>5)。
2.15 某厂有甲乙两个车间生产同类产品,产品的寿命(单位:年)分别服从参数为0.2和0.18的指数分布,现两车间的产品放在同一仓库里,甲车间产品占40%,乙车间产品占60%,现从仓库中随机取出1件产品,求该产品寿命大于5年的概率。
2.16 设随机变量X ~N(1,4),(1)分别求P (X a)=P(X
2.17 设电压小于200伏,在200~240伏之间,超过240伏三种情况下,某种电子元件正常工作的概率分别为0.9,0.999,0.75,电压X ~N(220,400),求元件正常工作的概率。 2.18从编号为1,2,3,4的四个球中,采用不放回抽样取2次球,每次取1个,X 表示取
到的两个球中小的号码,Y 表示大的号码,求(X,Y )的分布律。
2.19设(X , Y ) 的取值为(0,0),(0,1),(1,0),(1,1),已知P (X =0,Y =0)=0.4, P (X =0,Y =1)=P (X =1,Y =0)=P (X =1,Y =1)=c ,求c 的值。
2.20有甲,乙两盒分别有1个红球,2个黑球,从甲盒中取1球,并将其放入乙盒,搅匀后从乙盒不放回取2个球,X 表示从甲盒中取到的红球数,Y 表示从乙盒中取到的红球数,求(X,Y )的分布律。
2.21
已知P(X=1)=0.5(1)求a,b 的值;(2)分别求Y 的边际分布律,在X=0条件下Y 的条件分布律,在X=1条件下Y 的条件分布律。
2.22设X 与Y 是同分布的随机变量,P(X=1)=0.3, P(X=2)=0.7, P(X=2,Y=2)=0.6,求(X,Y )的分布律。
⎧k , 0
2.23 设随机变量(X,Y)的概率密度为f (x , y ) =⎨(1)求常数k ;(2)求
0, 其他. ⎩
P(X+Y>2);(3)P(X
⎧e -x , 0
2.24 设随机变量(X,Y)的概率密度f (x , y ) =⎨求X,Y 的边际概率密度
其他. ⎩0,
f X (x ), f Y (y ) 。
2
3, 0
{
率密度f X (x ), f Y (y ) ;(2)求条件概率密度f Y X (y x ) 。
2.26 设随机变量(X,Y)~N(0,1,1,4,0), 分别求X ,Y 的边际概率密度f X (x ), f Y (y ) 。 2.27 判断习题2.19,习题2.21和习题2.22中随机变量X 与Y 是否独立。 2.28 若(X , Y ) 的联合概率密度为f (x , y ) =⎨
⎧2, 0
,判断X 与Y 是否相互独立。 其他. ⎩0,
2.29若X 与Y 相互独立,X~U(0, 1), Y~U(0, 2),求(1)(X , Y ) 的联合概率密度,(2)P(X
2.30设随机变量X 的分布律为P(X=1)=0.1, P(X=2)=0.3, P(X=4)=0.2, P(X=6)=0.4, 令
Y =(X -3) 2,求Y 的分布律。
⎧x +1
, -1
2.31设随机变量X 的概率密度为f (x ) =⎨2,Y=2X+2,求Y 的概率密度
⎪0, 其他. ⎩
f Y (y ) 。
2.32设随机变量X~N(1, 4), 求2X-1的概率密度。
2.33设随机变量(X,Y)~N(0,1,1,4,0.5),求2X-Y-1的概率密度.
2.34 某地区成年男子身高X(单位:厘米) 服从正态分布N(170,169),从该地区独立抽选3人,求三人平均身高超过173厘米的概率。 2.35设随机变量(X,Y)的概率密度为f (x , y ) =⎨的概率密度;(2)N=min(X,Y)的概率密度。
⎧0.5, 0
求(1)M=max(X,Y)
0, 其他. ⎩