概率论:正态分布
第 四 章 正 态 分 布
第一节 第二节 第三节 第四节 第五节
正态分布的密度函数 正态分布的数字特征 正态分布的线性性质 二维正态分布 中心极限定理
PLAY
第一节
正态分布的密度函数
正态分布是实践中应用最为广泛,在理论上 研究 最多的分布之一,它在概率统计中占有特别重要的地 位.比如,考察一群人的身高,个体的身高作为一个随 机变量,其取值特点是:在平均身高附近的人较多,特 别高和特别矮的人较少.一个班的一次考试成绩、测 量误差等均有类似的特征.高斯在研究误差理论时曾 用它来刻画误差,因此很多文献中亦称之为高斯分布. 进一步的理论研究表明,一个变量如果受到大量 独立的因素的影响(无主导因素),则它一般服从正态 分布,这是中心极限定理探讨的问题.
一. 一般正态分布
1. 定义 若随机变量X的密度函数为
1 2 2 f ( x) e 2 其中 x ( x )2
f (x)
0
x
式中 为实数, >0 .则称X服从参数为 ,2的正态分 布,亦称高斯分布.记为N(, 2).可表为X~N(, 2). 图象见右上角
正态分布有两个特性: (1) 单峰对称 密度曲线关于直线x=对称
1 f()=maxf(x)= 2
f (x )
1 2
(2) 的大小直接影响概率的分布 越大,曲线越平坦; 越小,曲线越陡峻. 正态分布也称为 高斯(Gauss)分布
2
f (x )
0
N ( 4,3 / 5)
N ( 4,1)
x
N ( 4,7 / 5)
0
2
4
6 x
二. 标准正态分布
参数=0,2=1的正态分布称为标准正态 分布,记作X~N(0, 1)。 (x) 其密度函数为
1 (x) 2 ( x )
x2 e 2
4 2 0
2
4
x
分布函数为
(1) (0)=0.5
( x ) P { X x}
t2 x 1 e 2 2
(2) (+∞)=1;
dt , x
f (x)
f ( x) 1 e 2
x2 2
(3) (x)=1- (-x). 一般的概率统计教科书均附有 标准正态分布表供读者查阅 (x)的值.(P328附表1)如,若 X~N(0,1),(0.5)=0.6915, P{1.32
0
x
正态分布的数字特征 (一) 一般正态分布N(, 2)
( x)2 2 2
1 X ~ f (x) e 2
, x
E( X )
t
xf ( x)dx
t ( x
x
2
t2 2 e dt 2
x e 2
( x )2 2 2
dx
D( X )
) f ( x )dx
2
(二)标准正态分布N(0, 1)
X ~ f ( x)
E( X )
1 2
x2 e 2
, x
x 2
x2 e 2 dx
xf ( x ) dx
0(奇函数 )
2
D( X ) E{[ X E ( X )] }
2 x
2
[ x
E ( X )] f ( x)dx
1 2
x2 e 2 dx
1
三. 一般正态分布概率的计算 若X~N(,2),>0,则有
f (x )
F ( x ) P { X x}
x 1 e 2 (t ) 2 2 2
dt
x }
0
F ( x) P{X x} P{ P{Z ( x ).
X
(x )
x
x
} ( x ) /
t2 1 e 2 dt 2
x
一般地,有
0
例1 设随机变量 X ~ N (1, 2 ) , 求 P{1.6 X 2.4} 解 P{1.6 X 2.4} P{1.6 1 X 1 2.4 1} P{2.6 X 1 1.4} P{2.6 / 2 ( X 1) / 2 1.4 / 2} P{1.3 ( X 1) / 2 0.7} (0.7) (1.3)
(0.7) [1 (1.3)] 0.7580 [1 0.9032] 0.6612 .
P{a X b} P{a X b } a b a X b P{ } P{ Z } b a P{Z } P{Z } Z ~ N (0,1) b a ( ) ( ) 2
例2. 设 XN(,2),求P{-3
解 P{ 3 X 3 } P{( 3 ) X ( 3 ) } P{3 X 3 } P{ 3 X 3 } P{3 ( X ) / 3} (3) ( 3)
(3) [1 (3)] 2 (3) 1 0.9973
本题结果称为3原则.在工程应用中,通常认为 P{|X|≤3} ≈1,忽略{|X|>3}的值.如在质量控制中, 常用标准指标值±3作两条线,当生产过程的指标观察 值落在两线之外时发出警报,表明生产出现异常.
例 3 设随机变量 X ~ N ( 2, 2 ) , 且 P{2 X 4} 0 .3, 求 P{ X 0}. 随机变量 解 P{2 X 4} P{0 ( X 2) / 2 / } 标准化
(2 / ) (0) 0.3, (2 / ) 0.3 (0) 0.8
P{ X 0} P{( X 2) / 2 / } (2 / ) 1 (2 / ) 1 0.8 0.2 例 4 设随机变量 X ~ N ( 3, 4 ) , 且 常数 C 满足 P{ X C } P{ X C }, 求 常数 C . 解 由P{ X C} P{ X C}, 即 1 P{ X C} P{ X C} 所以 P{ X C} 0.5 X 3 C 3 C 3 另一方面 , P{ X C} P{ } ( ) 0.5 2 2 2 C 3 0 , C 3. 2
例 4(2004年) ( A)
2
设 X ~ N (0 , 1), 对于给定的 (0,1), 数 ( B)
满足 P{ X } . 若 P{ X x} , 则 x 等于
1
2
(C )
1
2
( D) 1
( x)
解 P { X x} P { x X x}
1 P{ X x} 2 故 x 1
2
x
x
1 2
1 2
例5
一种电子元件的使用寿命X(小时)服从正态分
布N(100,152),某仪器上装有3个这种元件,三个元件 损坏与否是相互独立的.求:使用的最初90小时内无 一元件损坏的概率. 解:设Y为使用的最初90小时内损坏的元件数,则Y~
B(3,p)
90 100 ) (0.67) 0.2514 其中 p P{ X 90} ( 15
P{Y 0} (1 p ) 3 0.4195 故
2 (2006年) 设随机变量X ~ N ( 1 , 12 ), Y ~ N ( 2 , 2 ),
且 P{ X 1 1} P{ Y 2 1}, 则必有 ( A) 1 2 . ( B ) 1 2 . (C ) 1 2 . ( B) 1 2 .
第二节 正态分布的数字特征 一. 一般正态分布N(, 2)
( x)2 2 2
1 X ~ f (x) e 2
, x
E( X )
t
xf ( x)dx
t ( x
x
2
t2 2 e dt 2
x e 2
( x )2 2 2
dx
D( X )
) f ( x )dx
2
二.
标准正态分布N(0, 1)
X ~ f ( x)
E( X )
1 2
x2 e 2
, x
x 2
x2 e 2 dx
xf ( x ) dx
0(奇函数 )
2
D( X ) E{[ X E ( X )] }
2 x
2
[ x
E ( X )] f ( x)dx
1 2
x2 e 2 dx
1
例1 已知随机变量X的密度函数为 1 x 2 2 x 1 f ( x) e , x 求 E ( X )、D ( X ) .
解
f ( x)
1
e
x 2 x 1
2
1 e 2 (1/ 2)
( x 1) 2 2(1/ 2 ) 2
1 故 1, 2
2
例2 设X服从N(0,1)分布,求E(X2),E(X3)
1 解 f (x) e 2 x2 x2 2 E ( X 2 ) x 2 f ( x)dx e dx 2 2 2
x2 2
x 2
x de 2
x 2
x 2 e
E( X )
3
3 x
f ( x) dx
x2 x3 2 e dx
1 2
x2 e 2 dx 1
2
0
2009年(数一) 设随机变量X的分布函数为F ( x) 0.3 ( x) 0.7 ( 其中 ( x)为标准正态分布函数, 则EX ( A)0. ( B )0.3. (C )0.7. ( D)1.
x 1 ), 2
分析 : EX xf ( x )dx ,因此先求随机变量 X的概率密度函数 f ( x ).
解 f ( x ) F ( x ) [ 0 . 3 ( x ) 0 . 7 (
0 .7 x 1 0 . 3 ( x ) ( ) 2 2
于是 EX
x 1 ) ] 2
xf ( x ) dx
x[0.3 ( x )
0 .7 x 1 ( )]dx 2 2
0.7 x 1 0.3 x ( x)dx x ( )dx 2 2
1 0 .3 x e 2
x2 2
0 .7 dx x 2
1 x 1 2 ( ) 2 2
1 x 1 2 ( ) 1 2 2 e dx 2
0
0 .7 1 x 2 e 2
1 x 1 2 ) ( 0 .7 1 2 2 dx dx x 2 e 2
x 1 令 t , 则dx 2dt , x 2t 1. 代入上式得 2
0 .7 1 x 2 e 2
1 x 1 2 ) ( 2 2
0 .7 1 dx (2t 1) 2 e 2
t2 2
2 dt
1 0 .7 2t e 2 2
t2 2
2 dt
0 .7 1 2 e 2
t2 2
2 dt
0. 7 1
0 2 e 2
t2 2
2dt 0.7
1 e 2
t2 2
dt 0.7.
2009 年
设随机变量 X与 Y相互独立 , 且 X服从标准正态分布 ,
1 Y的概率分布为 P{Y 0} P{Y 1} .记 FZ ( z )为随机变量 2 Z XY的分布函数 , 则函数 FZ ( z )的间断点个数为 ( A) 0 . ( B )1. (C ) 2 . ( D )3 .
解 FZ (z) P{Z z} P{XY z}
P{Y 0}P{XY z | Y 0} P{Y 1}P{XY z | Y 1}
1 [ P{ XY z | Y 0} P{ XY z | Y 1}] 2 1 [ P{ X 0 z | Y 0} P{ X 1 z | Y 1}] 2 为什么? 1 [ P { X 0 z } P { X z }] 2
1 (1)当z 0时, FZ ( z ) [ P{ X 0 z} P{ X z}] 2
1 1 [ P( ) P{ X z}] [0 P{ X z}] 2 2
1 1 P{ X z} ( z ) 2 2 1 (2)当z 0时, FZ ( z ) [ P{ X 0 z P{ X z}] 2
1 1 [ P() P{ X z}] [1 P{ X z}] 2 2
所以 , z 0为函数 FZ ( z )的间断点 . ( B )正确 .
1 [1 ( z )] 2
例 3 某地抽样调查结果表明 , 考生的外语成绩 (百分制) 近似服从正态分布 , 平均成绩为 72 分, 而 96以上的考 生占总数的 2.3%, 求考生的外语成绩在 60 分至 84 分 之间的概率 . 解 设 X — 考生的外语成绩, 依题设知X ~ N ( , 2 ), 其中 72, 下求方差 2 X 96 由题设 P{ X 96} 0.023 P{ } 0.023 X 96 96 1 P{ } 0.023, 即 1 ( ) 0.023
(
96
) 0.977,
96 96 72 2, 12 2 2
查表得 ,
96
于是 , P{60 X 84 } P{
60
X
84
}
60 72 X 84 72 X 1} P{ } P{1 12 12
(1) (1) (1) [1 (1)]
2 (1) 1 2 0.841 1 0.682
例 4 假设测量的随机误差 X ~ N ( 0,10 2 ).试求在 100 次 独立重复测量中 , 至少有三次测量的绝对 值大于 19 .6 的概率 ,并利用泊松分布求出 的近似值 . 解 先求每次测量误差的绝对值大于19.6的概率 p p P{ X 19.6} 1 P{ X 19.6} 1 P{19.6 X 19.6}
1 P{ 19.6
19.6 0 X 19.6 0 } 1 P{ 10 10 X 1 P{1.96 1.96} 1 [ (1.96) (1.96)]
1 [ (1.96) (1.96)] 1 (1.96) [1 (1.96)]
2 2 (1.96) 2 2 0.975 2 1.95 0.05
X
19.6
}
设 Y — 100次测量中绝对值大于19.6, 则Y ~ B (100,0.05)
于是所求的概率为 P{Y 3} 1 P{Y 0} P{Y 1} P{Y 2}
0 1 1 C100 (0.05) 0 (0.95)100 C100 (0.05)1 (0.95
)99 2 C100 (0.05) 2 (0.95)98
np 100 0 .05 5, 故由泊松分布得
1
0
0!
e
1
1!
e
2
2!
e
52 1 e (1 ) 1 e 5 (1 5 ) 0.87 2 2
2
习作题 1.设随机变量XN(0,1),YU(0,1),ZB(5,0.5),且 X,Y,Z独立,求随机变量U=(2X+3Y)(4Z-1)的数学 期望 答:
27 E (U ) E (2 X 3Y ) E (4 Z 1) 2
2 设随机变量 X 1 ,..., X n 相互独立,且均服从 N ( , 2 )
1 n 分布,求随机变量 X X i 的数学期望 n i 1 1 n 答: E ( X ) E ( X i ) n i 1
作业题
1. 设随机变量XB(12,0.5),Y N(0,1), COV(X,Y)=-1,求V=4X+3Y+1与W=-2X+4Y 的方差与协方差. 2. 某单位招聘2500人,按考试成绩从高分到低分依 次录用,共有10000人报名.假定报名者的考试成绩X 服从正态分布 N ( , 2 ), 现已知90分以上有359人, 60分以下的有1151人,求被录用者中的最低分数.
第三节 正态分布的线性性质 一. 线性性质 例1 设随机变量X服从标准正态分布,求随机变量 Y a X b ~ N (b, a2 ) Y=aX+b的密度函数,且有
y b 解: Y=ax+b关于x严单,反函数为 h( y ) a
y b fY ( y) f X ( ) h( y) 1 a 2
E (Y )
y b a 2 e
2
1 a
1 2 a
e
( y b ) 2 2a2
y e 2 a
( y b ) 2 2a 2
dy
ax b 2
x2 e 2 dx
b
D (Y ) E{[Y E (Y )]2 } [ y E (Y ) ]2 f ( y ) dy
( y b)2 2 a 2 2 e dy a 2 a 直接由Y的密度函数,可观察到Y的数学期望与方差
1 2a 2 , 由 f ( y) e 2 a 可知随机变量Y服从正态分布, ( y b) 2
( y b)2
而且 E (Y ) b , D (Y ) a 2
定理1 设随机变量X 服从正态分布N(, 2),则X的线性 函数 Y a b X 也服从正态分布,且有 Y a bX ~ N ( a b , a 2 2 )
例2
已知XN(,2),求 Y
X
解 Y X 关于x严格单调,反函数为 h( y) y 故 fY ( y) f X [h( y)] | h( y) | f X (y )
的概率密度
1 e 2
y 2
2
2
1 e 2
y2 2
你能用正态分布的线性性质求解吗?
二. 正态分布的可加性
定理2 设随机变量X1,X2 相互独立且Xi 服从正态分布N(i ,i2),i=1,2, 则 2 2 2 2 a1 X 1 a2 X 2 ~ N (a11 a2 2 , a1 1 a2 2 ) 定理3 设随机变量X1, X2,..., Xn独立且Xi 服从正态分布N(i ,i2),i=1,...,n, 则
n
i 1
a i X i ~ N ( a i i , a i2 i2 )
i 1 i 1
n
n
例1. 设随机变量X与Y独立且均服从标准正态 分布,求证:Z=X+Y服从N(0,2)分布.
解 依题设 X ~ N ( 0,1) , Y ~ N ( 0,1) ; 故有
E ( X ) 0 , D ( X ) 1 , E (Y ) 0 , D (Y )
1
于是由定理 2可知 X Y服从正态分布 , 且有
E ( X Y ) E ( X ) E (Y ) 0 0 0
D ( X Y ) D ( X ) D (Y ) 1 1 2,
即 X Y ~ N (0 , 2 )
例2. 设随机变量X与Y独立,且X~ N(1,2),Y~N(0,1). 求证:(1)Z=2X-Y+3的密度函数;(2)P{2
D ( Z ) D ( 2 X Y 3) 4 D ( X ) E (Y ) 8 1 9
Z 2 X Y 3 ~ N (5,9) 2 Z 8 Z (2) P{2 Z 8} P{ } P{1 1} (1) (1) (1) [1 (1)] 即
2 (1) 1 2 0.8413 1 0.6826
第四节
二维正态分布
一. 密度函数 若随机变量(X,Y)的密度函数为
f ( x, y )
1 212 1
2
e
1 ( x 1 ) 2 ( x 1 )( y 2 ) ( y 2 ) 2 [ ] 2 2 2 2 12 2( 1 ) 2 1
,
其中,1、2为实数,1>0、 2>0、| |
( X , Y ) ~ N ( 1 , 2 , , , )
2 1 2 2
二、边缘密度函数 2 设(X, Y)~f(x,y),(x,y)R ,则称 f X ( x) f ( x, y )dy 为(X,Y)关于X的边缘密度函数; 同理,称 fY ( y ) f ( x, y )dx
为(X, Y)关于Y的边缘密度函数。 易知N(1,2,12,22,)的边缘密度函数fX(x)是 N(1, 12)的密度函数,而fX(x)是N(2, 22)的密度函 数, 且 XY . 即 二维正态分布的边缘分布也是正态分布. 可见,若(X,,Y)服从二维正态分布,则X与Y独立 的充分必要条件是X与Y不相关。
例 设(X,Y)服从N(1, 0, 32, 42, -0.5)分布, Z=X/3+Y/2 1)求E(Z) , D(Z) ;2)求X与Z的相关系数 3)问X与Z是否相互独立?为什么?
解 (1) 由( X , Y ) ~ N (1, 0 , 32 , 4 2 , 0.5), 得 E ( X ) 1 , D ( X ) 32 , E (Y ) 0 , D (Y ) 4 2 , XY 0.5
故 Cov ( X , Y ) D ( X ) D (Y ) XY 3 4 (0.5) 6
于是 E ( Z ) E ( X / 3 Y / 2) E ( X ) / 3 E (Y ) / 2 1/ 3 0 / 2 1/ 3 D ( Z ) D ( X / 3 Y / 2) D ( X ) / 9 D (Y ) / 4 C 0v( X , Y ) / 6
3 2 / 9 4 2 / 4 ( 6 ) / 6 4
2) Cov( X , Z ) Cov( X , X / 3 Y / 2)
Cov( X , X / 3) Cov( X , Y / 2) 1 1 Cov ( X , X ) Cov ( X , Y ) 2 3
1 1 D ( X ) Cov ( X , Y ) 3 2
1 1 2 3 (6) 0 3 2 故 X 与 Z 不相关 . X Y (3) 因 X 与 Y不独立 ,而 Z 3 2 故 X 与 Z 不独立 .
(2007年) 设随机变量( X , Y )服从二维正态分布, 且X与Y不相关, f X ( x), fY ( y )分别表示X , Y的概率密度, 则在Y y的条件下, X的 条件
密度函数f X |Y ( x | y )为 ( A) f X ( x) (C ) f X ( x) fY ( y ) ( B) fY ( y ) f X ( x) ( D) fY ( y )
( 2003年) 设随机变量 X和Y都服从正态分布 , 且它们不相关 , 则 ( A) X与Y一定独立. (C ) X与Y未必独立. ( B ) ( X , Y )服从二维正态分布 . ( B ) X Y服从一维正态分布 .
第五节 中心极限定理
一. 依分布收敛
设{Xn}为随机变量序列,X为随机变量,其 对应的分布函数分别为Fn(x), F(x). 若在F(x)的 连续点,有 lim Fn ( x ) F ( x ),
n
则称{Xn}依分布收敛于X. 可记为 X n w X .
现令Yn X k , 若Yn的标准化r.v.Yn* k 1 则称{ X n }满足中心极限定理.
n
~ N (0, 1),
w
二.几个常用的中心极限定理
1.独立同分布中心极限定理(Levy-Lindeberg) 设{Xn}为独立同分布随机变量序列,若 EXk=
P{ X i x} P{
i 1 n i 1
X i n n
n
x n x n } ( ) n n
或者
P{ i 1
X i n n
n
x} ( x)
例1.将一颗骰子连掷100次,则点数之和不少于 500的概率是多少? 解:设 Xk为第k 次掷出的点数,k=1,2,…,100,则 X1,…,X100独立同分布.
1 6 2 49 35 7 E ( X 1 ) , D( X 1 ) k 6 i 1 4 12 2
由中心极限定理
7 500 100 100 2 P{ X i 500 } 1 35 i 1 10 12 1 (8.78) 0
例2 设X 1 , X 2 ,, X n , 为独立同分布的随机变量序列, 且均 服从参数为 ( 1)的指数分布, 记 ( x)为标准正态分布, 则
( A) lim P{i 1
n
X i n
n
n
n
x} ( x). (B) lim P{i 1
n n
X i n n n Xi
n
x} ( x) x} ( x)
(C) lim P{
n
Xi n
i 1
n 解 E ( X i ) 1 / , D ( X i ) 1 / 2
n
x} ( x).
(D) lim P{i1
n
i 1
X i E ( X i )
i 1
n
D ( X i )
i 1
n
i 1
X i E( X i )
i 1 i 1
n
n
D( X i )
n
i 1
Xi n / n / 2
n
Xi n
i 1
n
n
于是 lim P{
n
Xi n
i 1
n
n
x} ( x) (2005年)
2.德莫佛-拉普拉斯中心极限定理(De Moivre-Laplace)
设随机变量n(n=1, 2, ...)服从参数为n, p(0
n np
npq
~ N (0, 1).
w
证明:设 则
1 第i次试验事件A发生 Xi 0 第i次试验事件A不发生
n i 1
E ( X i ) p, D( X i ) p (1 p ),n X i
由中心极限定理,结论得证
例3 在一家保险公司里有10000个人参加寿命保险,每 人每年付12元保险费.在一年内一个人死亡的概率为 0.6%,死亡时其家属可向保险公司领得1000元,问: (1)保险公司亏
本的概率有多大? (2)其他条件不变,为使保险公司一年的利润不少于 60000元,赔偿金至多可设为多少? 解 设X表示一年内死亡的人数,则X~B(n, p), 其中n= 10000,p=0.6%,设Y表示保险公司一年的利 润, Y=1000012-1000X 于是由中心极限定理 (1)P{Y
例4.卡车装运水泥,设每袋水泥的重量X(kg)服从 N(50,2.52)分布,该卡车的额定载重量为2000kg,问最 多装多少袋水泥,可使卡车超载的概率不超过0.05.
解: 设最多装n袋水泥,Xi为第i袋水泥的重量.则
n
X
i 1
i
~ N (50n,2.5 n) 令 P{ X i 2000} 0.05
2
n
2000 50 n 故 P{ X i 2000 } 1 ( ) 0.05 2 .5 n i 1 查 2000 50n 2000 50 n 即 ( ) 0.95 表 1.645 2.5 n 2 .5 n 得 n 39
n
i 1