1-2一些常用的抽样分布
§2 一些常用的抽样分布
首先介绍三种来自正态母体的
t -分布、χ-分布、重要的抽样分布:
2
F -分布.
2.1
χ-分布
2
(1)Γ 函数、B 函数及其性质: γ>0, 定义:对称
Γ(γ) =
+∞
⎰0
x
γ-1-x
e
dx 为Γ 函数;
对
a >0, b >0
x )
b -1
称
B(a , b ) =
1a -1
(1-⎰0x
dx 为B 函数.
性质:
1
Γ(1) =1, Γ() =; ① 2②
Γ(γ+1) =γΓ(γ), Γ(n +1) =n ! , 对γ∈(0, 1), 查表可求Γ(γ);
1
n +1Γ()
1=; lim
2 ③n →∞n Γ(n )
2
Γ(a ) Γ(b )
B(a , b ) =. ④Γ(a +b )
χ分布的定义:X 1, X 2, , X n 是(2)
来自母体X ~N (0, 1) 的一个子样,则称
222χ2=X 1+X 2+ +X n 服从自由度为n 的
2
χ分布,记为:
χ2~χ2(n )
2
(3)概率密度函数f n (x ) 及其图形:
利用数学归纳法、卷积公式可证,
n x ⎧-1-1
⎪n x 2e 2, x >0时⎪
f n (x ) =⎨22Γ(n )
2⎪
⎪0,
⎩ x ≤0时
2
>>hold off
>>x=[0:0.5:40];
>>f1=chi2pdf(x,1);f2=chi2pdf(x,4);f3=chi2pdf(x,10);f4=chi2pdf(x,20);
>>plot(x,f1,'r') >>hold on
>>plot(x,f2,'g') >>hold on
>>plot(x,f3,'b') >>hold on
>>plot(x,f4,'m')
3
2χ(4)分布的性质:
22
χ~χ(n ) ,则①期望、方差:
E (χ) =n , D (χ) =2n ;
2222
χ=X +X + +X 证明:12n ,其中
22
X 1, X 2, , X n 是来自母体X ~N (0, 1) 的一个
子样,故
n
n
i =1
i =1
E (χ2) =E (∑X i 2) =∑E (X i 2) =nE (X 2) =n [D (X ) +E 2(X )]=n
n
n
i =1
i =1
D (χ2) =D (∑X i 2) =∑D (X i 2) =nD (X 2) =n [E (X 4) -E 2(X 2)]=
2
χ~χ(n 1) ,②可加性,即:若1
2
2
χ2
2
χ~χ(n 2) ,且χ1与2相互独立,则有
2
2
χ1+χ2~χ2(n 1+n 2) .
22
注:用数学归纳法、卷积公式、
Γ 函数与B 函数的关系可证,略.
③极限性质:设χ~χ(n ), 则对
4
22
的分2n
F (x ) =Φ(x ) lim F (x ) n 布函数n 满足:n →∞.
即当n 充分大时,
∴χ
2近似
∀x ∈R 有χ的标准化变量
2
χ-n
2
χ2-n 近似
2n
~N (0, 1) ,
~N (n ,
2n ) .
2
2
222χ2=X 1+X 2+ +X n
证明:χ~χ(n ), 故可设:
其中X 1, X 2, , X n 相互独立,且
X i ~N (0, 1), i =1, 2, n . 从而有
22X 1, X 2, , X 2由n 相互独立且同分布,
中心极限定理及χ分布的性质①知:χ的标准化变量足:
n →∞
5
22
χ-n
2
F n (x ) 满分布函数2n
lim F n (x ) =Φ(x )
证毕. 即当n 充分大
时,
χ-n 近似
2n .
2
~N (0, 1), 从而χ
2近似
~N (n , 2n )
2χ(5)分布的上侧分位数:
①随机变量的上侧分位数
定义:设X 的分布密度为f(x), 则
+∞
P (X ≥x α) =⎰x f (x ) dx =α α
对∀α∈(0,1), 存在唯一实数x α, 使
称实数x α为X 的上α分位数.
②N (0, 1) 的上侧分位数
定义:设U ~N (0, 1) ,
则
对∀α∈(0,1), 存在唯一
实
6
数
u α
+∞
⎰u αφ(
, 使
P (U ≥u α) =
x ) dx =α
称实数u α为U 的上α分位数.
求法:P (U ≥u α) =1-P (U ≤u α) =1-Φ(u α) =α,故:Φ(u α) =1-α,反查标准正态分布函数表,可得u α值.
2χ③分布的上侧分位数
:设χ~χ(n ), 则
22
对∀α∈(0,1), 存在唯一实数χα2(n ) , 使
P (χ≥χα(n )) =⎰+∞2
2
2
χα(n )
f n (x ) dx =α
22χ(n ) 称实数α为χ的上α分位数.
查表:附表3——χ分布的上侧分位数表(P261) 性质:当
2
n >45
时,
χα(n ) ≈n +u α2n
22χ~χ(n ), 由上侧分位数定证明:
2
义知
7
P (χ≥χα(n )) =α
22
∴P (
χ-n
2n
2
≥
χ(n ) -n
2n
2
) =α
对于U ~N (0, 1) , 有
2χ再由分布的极限性质知:
P (U ≥u α) =α
Y =
χ-n 近似
2n
2
~N (0, 1), 这里n =45
结合(1)、(2)即
χ(n ) -n
2n
2
≈u α
:
2
χα(n ) ≈n +u α2n
证毕.
求χ0. 05(120) 解
8
2
:
n =120>45, α=0. 05, Φ(u 0.05) =1-0. 05=0. 9查表知:u 0.05=1. 645
2
∴χα(n ) ≈n +u α2n =120+1. 645⨯2⨯12
例1.2.2 设X 1, X 2, , X 10是来自母体
2
P (X X ~N (0, 0. 3) 的一个子样,求∑i >1. 44) .
2
10
i =1
解:X 1, X 2, , X 10相互独立,且
X i ~N (0, 0. 32),
X i ∴~N (0, 1), 且当i =1, 2, ,10时相互独立0. 310X 22i ∴() ~χ(10), i ∑
=10. 3
P (∑X i 2
i =1
10
10X 2X 21. 44>1. 44) =P (∑() >) =P (() >16∑2
i =10. 3i =10. 30. 3
10
则: χα(10) =16, 查表知 α=0.10.
2
2.2 t -分布
(1)定义:设X ~N (0, 1) ,
Y ~χ(n ) ,且X 与Y 相互独立,令
9
2
X T =T 服从自由度为n 的t 分,则称/n
布,记为:T ~t (n )
(2)概率密度函数f n (t ) 及其图形:
n +1
Γ() 2-n +1
t f n (t ) =(1+) 2, -∞
n n n () 2
>>hold off
>>x=[-5:0.1:5];
>>f1=tpdf(x,1);f2=tpdf(x,2);f3=tpdf(x,5);f4=tpdf(x,10); f5=normpdf(x,0,1);
>>plot(x,f1,'k') >>hold on
>>plot(x,f2,'g') >>hold on
>>plot(x,f3,'b') >>hold on
>>plot(x,f4,'m') >>hold on >>plot(x,f5,'r')
10
(3)性质:分布的极限分布是N (0, 1) .
f lim 证明:
n →∞
n
(t ) =lim
n →∞
n +1
n +1Γ() 2-t (1+) 2
n n πΓ() 2
n +1Γ() n +12
-1t 2
=(1+) lim lim n n →∞n Γ() n →∞
21t t 2
=[(1+) ]lim n 2n →∞
1
2
n
t 2
-2
t 2-1
[(1+) 2
n
11
1=e
2π
t 2-2
=ϕ(t )
证毕.
注:n 很大时,t (n ) ~N (0, 1)
(4)t 分布的上侧分位数
近似
(0,1), 存定义:设T ~t (n ) 则对∀α∈
在唯一实数t α(n ) , 使
P (T ≥t α(n )) =
+∞
⎰t α(n ) f n (
x ) dx =
称实数t α(n ) 为T 的上α分位数.
查表:附表2——t 分布的上侧分位数表(P259)
:①t 1-α(n ) =-t α(n ) ②当
n >45时, t α(n ) ≈u α
2.3 F -分布
(1)定义:设X ~χ(n 1), Y ~χ(n 2),
12
2
2
X /n F =且X 与Y 相互独立,则称F 服Y /n 2,
n 1为第一自从自由度为(n 1, n 2) 的F 分布,
由度、
n 2
为第二自由度. 记为:
F ~F (n 1, n 2)
(2)概率密度函数f (z ) 及其图形:
⎧n 1+n 2
n 1Γ() n 1n 1+n 2
⎪-1-n n 12122
() z (1+z ) , z >0时⎪n
n 2f (z ) =⎨Γ(1) Γ(n 2) n 2
⎪22⎪
0, z ≤0时⎩
>>hold off
>>x=[0:0.05:6];
>>f1=fpdf(x,4,10);f2=fpdf(x,10,10);f3=fpdf(x,20,10);f4=fpdf(x,50, 10);
>>plot(x,f1,'r') >>hold on
>>plot(x,f2,'g') >>hold on
>>plot(x,f3,'b')
13
>>plot(x,f4,'m')
>>x=[0:0.05:6];
>>f1=fpdf(x,10,4);f2=fpdf(x,10,10);f3=fpdf(x,10,20);f4=fpdf(x,10, 50);
>>plot(x,f1,'r') >>hold on
>>plot(x,f2,'g') >>hold on
>>plot(x,f3,'b')
14
(3)F 分布的上侧分位数 :设F ~F (n 1, n 2) ,则
对∀α∈(0,1), 有唯一实数F α(n 1, n 2) , 使
P (F ≥F α(n 1, n 2)) =
+∞
⎰F α(n 1, n 2)
f (z ) dz =α
称实数F α(n 1, n 2) 为F 的上α分位数.
α 较小时, 查附表4——F 分布的上侧分位数表(P266)
:①F ~F (n 1, n 2) , 则
15
1
~F (n 2, n 1) ; F
2
T ~t (n ), 则 T ~F (1, n ) ; ②
1F (n , n ) =α12③F 1-α(n 2, n 1) .
证明:①
X /n F ~F (n 1, n 2) ∴可设 F =
Y /n 2,
22
Y ~χ(n 2) ,且X 与X ~χ(n ) 其中:1,
Y
相互独立
1Y /n ∴=
F X /n 1
1
则由F 分布的定义知: F ~F (n 2, n 1) .
X
∴可设T =② T ~t (n ) , /n
其中:X ~N (0, 1) ,Y ~χ(n ) ,且X 与Y 相互独立
22
X X /12
∴T == Y /n Y /n
16
2
其中: X ~N (0, 1) , X ~χ(1) ,且X 与Y 独立
222
∴T ~F (1, n ) .
2
③设F ~F (n 1, n 2) , 由上侧分位数定义知
111
α=P {F ≥F α(n 1, n 2)}=P {≤}=1-P {
F F α(n 1, n 2) F
11
∴P {≥}=1-α
F F α(n 1, n 2)
,又
1
~F (n 2, n 1) , 故: F
1
=F 1-α(n 2, n 1)
F α(n 1, n 2)
.
证毕
注:当α较接近1时,F α(n 1, n 2) 不能从附表4直接查到,故应查表求F 1-α(n 2, n 1) ,再用此公式计算F α(n 1, n 2) .
求F 0. 95(12, 9)
17
解
11
F 0. 95(12, 9) ===0. 375
F 0.05(9, 12) 2. 80
:
例1.2.4 X 1, X 2, , X 8是来自母体X ~N (μ, σ2) 的一个子样,求随机区间
(X -μ) 28(X -μ) 2(∑, ∑) 长度的期望与方差。 42i =1i =1
8
88
(X i -μ) 2(X i -μ) 2(X i -μ) 2
-∑=∑解:L =∑244i =1i =1i =1
8
88
(X i -μ) 2(X i -μ) 2(X -μ) 2
E (L ) =E (∑) =∑E () =∑E ()
444i =1i =1i =1
8
2
2
=2E (X -μ) =2E (X -E (X )) =2D (X ) =2σ
8(X i -μ) 2(X i -μ) 2
D (L ) =D (∑) =∑D ()
44i =1i =1
8
(X -μ) 21
=∑D () =D (X -μ) 2
42i =1
8
X
∴(
X -μ
~N (μ, σ)
2
∴
X -μ
σ
~N (0, 1)
σ
) 2~χ2(1)
∴D (
X -μ
σ
) =2
2
∴D (X -μ) =2σ
18
24
1
∴D (L ) =D (X -μ) 2=σ4
2
2.4 抽样分布定理
(1)单个正态母体情形
定理1 设母体X 有:
2
E (X ) =μ, D (X ) =σ, X 1, X 2, , X n 是X 的一个子样,X 是子样均值,则:
①E (X ) =μ, D (X ) =②
2
σ2
n
;
特别,
X ~N (μ,
当
σ2
n ),
X ~N (μ, σ) 时,
X -μ
∴~N (0, 1) . σ/n
2
定理2 X 1, X 2, , X n 是来自母体
X ~N (μ, σ) 的一个子样,则
*2
(n -1) S n
2
①
σ
~χ(n -1) ;
2
*2
②X 与S n
独立;
19
X -μ
③S n */n ~t (n -1) .
(2)两个正态母体情形
定理3 X 1, X 2, , X n 1是来自母体
2
X ~N (μ1, σ1) 的一个子样,Y 1, Y 2, , Y n 2是2
Y ~N (μ, σ来自母体22) 的一个子样,X , Y
相互独立则
①
(X -Y ) -(μ1-μ2)
σ
*2S *2S Y
21
n 1
+
σ
22
~N (0, 1)
;
n 2
②③
2/σ2/σ2
~F (n 1-1, n 2-1)
当
σ12=σ22=σ2
时,
(X -Y ) -(μ1-μ2)
~t (n 1+n 2-2)
11 *
S W +
n 1n 2
其中:
*2S W
=
*2
(n -1) S *2
+(n -1) S n 1+n 2-2
(3)大子样情形(子样容量n ≥50)
20
定理4 ①X 1, X 2, , X n 是来自母体X 的一个子样,n ≥50, E (X ) =μ,则X -μ近似~N (0, 1) ; S /n
②X 1, X 2, , X n 1是来自母体X 的一个
子样,n 1≥50, E (X ) =μ1,Y 1, Y 2, , Y n 2是来自母体Y 的一个子样,n 2≥50, E (Y ) =μ2,X , Y 相互独立, 则(X -Y ) -(μ1-μ2) 近似~N (0, 1) 22S 1S 2. +n 1n 2
21