1概率论与数理统计第六章
第六章 样本及抽样分布
前面五章我们讲述了概率论的基本内容,随后的四章将讲述数理统计. 数理统计是具有广泛应用的一个数学分支,它以概率论为理论基础,根据试验或观察得到的数据,来研究随机现象,对研究对象的客观规律性作出种种合理的估计和判断.
数理统计的内容包括:如何收集、整理数据资料; 如何对所得的数据资料进行分析、研究,从而对所研究的对象的性质、特点作出判断. 后者就是我们所说的统计推断问题. 本书只讲述统计推断的基本内容.
在概率论中,我们所研究的随机变量,它的分布都是已知假设的,在这一前提下去研究它的性质、特点和规律性,例如求出它的数字特征,讨论随机变量函数的的分布,介绍常用的各种分布等. 在数理统计中,我们研究的随机变量,它的分布是未知是的,或者是不完全知道的,人们是通过对所研究的随机变量进行重复独立的观察,得到许多观察值,对这些数据进行分析,从而对所研究的随机变量的分布作出种种推断的.
本章我们介绍总体、随机样本及统计量等基本概念,并着重介绍几个常用统计量及抽样分布.
§ 1 随机样本
我们知道,随机试验的结果很多是可以用数来表示的,另有一些试验的结果虽是定性的,但总可以将它数量化. 例如,检验某个学校学生的血型这一试验,其可能结果有O 型、A 型、
B 型、AB 型4种,是定性的. 如果分别以1,2,3,4, 依次记这4种血型,那么试验的结果就
能用数来表示了.
在数理统计中,我们往往研究有关对象的某一项数量指标(例如 研究某种型号的灯泡的寿命这一数量指标). 为此,考虑这一数量指标相联系的随机试验,对这一数量指标进行试验或观察. 我们将试验的全部可能的观察值称为总体,这些值不一定都不相同,数目上也不一定是有限的,每一个可能观察值称为个体. 总体中所包含的个体的个数称为总体的容量.
容量为有限的称为有限总体,容量无限的称为无限总体.
例如在考察某大学一年级男生的身高这一试验中,若一年级男生共2000人,每个男生的身高是一个可能观测值,所形成的总体中共含2000个可能观测值,是一个有限总体. 又如考察某一湖泊中某种鱼的含汞量,所得总体也是有限总体. 观察并记录某一地点每天(包括以往、现在和将来)的最高气温,或者测量一湖泊任一地点的深度,所得总体是无限总体. 例如,考察全国正在使用的某种型号灯泡的寿命所形成的总体,由于可能观测值的个数很多,就可以认为是无限总体.
总体中的每一个个体是随机试验的一个观测值,因此它是某一随机变量X 的值,这样,一个总体对应于一个随机变量X . 我们对总体的研究就是对一个随机变量X 的研究,X 的分布函数和数字特征就称为总体的分布函数和数字特征. 今后将不区分总体与相应的随机变量,笼统称为总体X .
例如,我么检验自生产线出来的零件是次品还是正品,以0表示产品为正品,以1表示产品为次品. 设出现次品的概率为p (常数),那么总体是由一些“1”和一些“0”所组成,这一总体对应于一个具体的参数为p 的(0—1)分布:
1-x
P {X =x }=p x (1-p ), x =0,1
的随机变量. 我们就将它说成是(0—1)分布总体. 意指总体中的观察值是(0—1)分布
随机变量的值. 又如上述灯泡寿命这一总体的是指数分别总体,意指总体中的观察值是指数分布随机变量的值.
在实际中,总体的分布一般是未知的,或只知道它具有某种形式而其中包含着未知参数. 在数理统计中,人们都是通过从总体中抽取一部分个体,根据获得的数据来对总体分布得出推断的. 被抽出的部分个体叫做总体的一个样本.
所谓从总体抽取一个个体,就是对总体X 进行一次观察并记录其结果. 我们在相同情况下对总体X 进行n 次重复的、独立的观察. 将n 次观察结果按试验的次序记为
X 1, X 2,
, X n . 由于X 1, X 2, , X n 是对随机变量X 观察的结果,且各次观察是在相同的条
X 1, X 2,
, X n 是相互独立的,且都是与X 具有相同分布
件下独立进行的,所以有理由认为的随机变量. 这样得到的
X 1, X 2,
, X n 称为来自总体X 的一个简单随机样本,n 称为这样样
本的容量. 以后如无另外说明,所提到的样本都是指简单的随机样本.
当n 次观察一经完成,我们就得到一组实数
x 1, x 2,
, x n ,它们依次是随机变量
X 1, X 2,
, X n 的观察值,称为样本值.
对于有限总体,采用放回抽样就能得到简单随机样本,但放回抽样使用起来不方便,当个体的总数N 比得到的样本的容量n 大得多时,在实际中可将不放回抽样近似地当作放回抽样来处理.
至于无限总体,因抽取一个个体不影响它的分布,所以总是用不放回抽样. 例如,在生产工程中,每隔一定时间抽取一个个体,抽取n 个就得到一个简单随机样本,实验室中的记录,水文、气象等观察资料都是样本. 试制新产品得到的样品的质量指标,也常被认为是样本.
综上所述,我们给出以下定义.
定义 设X 是具有分布函数F 的随机变量,若
X 1, X 2,
, X n 是具有同意分布函数
F 的、相互独立的随机变量,则称X 1, X 2, , X n 为从分布函数F (或总体F 、或总体X )
x 1, x 2,
, x n 称为样本值,又称
得到的容量为n 的简单随机样本,简称样本,它们的观察值为X 的n 个独立的观察值.
也可以将样本看成是一个随即向量,写成((
X 1, X 2,
, X n )
,此时样本值相应的写成
, X n )
x 1, x 2,
, x n ). 若(x 1, x 2, , x n )与(y 1, y 2, , y n ) 都是相应于样本(X 1, X 2,
的样本值,一般来说它们是不相同的.
由定义得:若
X 1, X 2,
, X n 为F 的一个样本,则X 1, X 2, X 1, X 2,
, X n )的分布函数为
n
, X n 相互独立,且它们的
分布函数都是F ,所以(
F (x 1, x 2,
*
, x n ) =∏F (x i )
i =1
.
X , X , 又若X 具有概率密度f ,则(12, X n )的概率密度为
f (x 1, x 2,
*
, x n ) =∏f (x i )
i =1
n
.
§ 2 抽样分布
样本是进行统计推断的依据. 在应用时,往往不是直接使用样本本身,而是针对不同的问题构造样本的适当函数,利用这些样本的函数进行统计推断.
定义 设
X 1, X 2,
, X n 是来自总体X 的一个样本,g (X 1, X 2, , X n ) 是
X 1, X 2,
, X n 的函数,若g 中不含未知参数,则称g (X 1, X 2, X 1, X 2,
, X n 都是随机变量,而统计量g (X 1, X 2,
x 1, x 2,
, x n 是相应于样本X 1, X 2,
, X n ) 是一统计量. , X n ) 是随机变量的函数,因, X n 的样本值,则称
因为
此统计量是一个随机变量. 设
g (x 1, x 2,
, x n ) 是g (X 1, X 2, , X n ) 的观察值.
X 1, X 2,
, X n 是来自总体X 的一个样本,x 1, x 2,
, x n
下面列出几个常用的统计量. 设是这一样本的观察值. 定义
样本平均值:
1n
=∑X i
n i =1;
样本方差:
n
1n 12
(X i -) =(∑X i 2-nX ) ∑n -1i =1n -1i =1
;
S
2=
样本标准差:
S ==
样本k 阶(原点)矩
1n k
A k =∑X i , k =
1,2,
n i =1
;
样本k 阶中心矩
1n
B k =∑(X i -) k , k =
1,2,
n i =1
它们的观察值分别为
.
1n
x =∑X i
n i =1;
n
1n 12
s =(x i -x ) =(∑
x i 2-nx ) ∑n -1i =1n -1i =1
; 2
s ==;
1n k
a k =∑x i , k =
1,2,
n i =1
;
1n
b k =∑(x i -x ) k , k =
1,2,
n i =1
.
这些观察值仍分别称为样本均值、样本方差、样本标准差、样本k 阶(原点)矩以及
样本k 阶中心矩.
k
E (X ) k X 我们指出,若总体的阶矩
记成
μk 存在,则当n →∞时,
k
X n
P
A k −−→μk , k =1,2, . 这是因为X 1, X 2, k
, X n 独立且与X 同分布,所以X 1k , X 2,
独立且与X 同分布. 故有
k
k
E (X 1k ) =E (X 2) =k
=E (X n ) =μk , k =1,2,
从而由第五章的辛钦定理知
1n k P
A k =∑X i −−→μk , k =
1,2,
n i =1
进而由第五章中关于依概率收敛的序列的性质知道
其中g 为连续函数. 这就是下一章所要介绍的矩估计法的理论根据.
经验分布函数 此外,我们还可以作出与总体分布函数F (x )相应的统计量——经验分布函数. 它的作法如下:设示
X 1, X 2,
, X n 是总体F 的一个样本,用S (x ) ,-∞
X 1, X 2,
, X n 中不大于x 的随机变量的个数. 定义经验分布函数F n (x ) 为
1
S (x ), -∞
F n (x ) =
对于一个样本值,那么经验分布函数
F n (x ) 的观察值是很容易得到的(F n (x ) 的观察值仍以
F n (x ) 表示). 例如
F 3(x ) 的观察值为
(1)设总体F 具有一个样本值1,2,3,则经验分布函数
⎧0, 若x
⎪1, 若1≤x
F 3(x ) =⎨3
⎪2, 若2≤x
⎪1, 若x ≥3. ⎩
(2)设总体F 具有一个样本值1,1,2,则经验分布函数
F 3(x ) 的观察值为
⎧0, 若x
F 3(x ) =⎨, 若1≤x
⎪3⎪⎩1, 若x ≥2.
x 1, x 2,
, x n 是总体F 的一个容量为n 的样本值. 先将x 1, x 2,
, x n 按自小到大
一般,设
的次序排列,并重新编号. 设为
x (1)≤x (2)≤≤x (n ) .
则经验分布函数
F n (x ) 的观察值为
0, 若x
F n (x ) =⎨, 若x (k ) ≤x
⎪n
1, 若x ≥x (n ) . ⎪⎩
F n (x ) ,格里汶科(Glivenko)在1933年证明了一下结果:对于任一实
对于经验分布函数数x ,当n →∞时
F n (x ) 以概率1一致收敛于分布函数F (x ) ,即
P lim sup F n (x ) -F (x ) =0=1.
n →∞-∞
{}
因此,对于任一实数x 当n 充分大时,经验分布函数的任一个观察值
F n (x ) 与总体分布函数
F (x ) 只有微小的差别,从而在实际上可以当作F (x ) 来使用.
统计量的分布称为抽样分布,在使用统计量进行推断时常需知道它的分布. 当总体的分布函数已知时,抽样分布是确定的,然而要求出统计量的精确分布,一般来说是困难的. 本节介绍来自正态总体的几个常用的统计量的分布.
2
X , X , , X n 是来自总体N (0,1)的样本,则称统计量 χ (一)分布 设12
2
χ2=X 12+X 2+
2
X n
(2.1)
χ
服从自由度为n 的χ分布,记为
2
2
χ2(n )
此处,自由都是指(2.1)式右端包含的独立变量的个数.
2χ(n )分布的概率密度为
1⎧
y n -1e -y 2, y >0⎪n 2
f (y ) =⎨2τ(2)
⎪0, 其它. ⎩ (2.2)
f (y ) 的图形如图6—1所示
.
图 6—1
现在来推求(2.2)式.
首先由第二章 § 5 例3及第三章 § 5 例3知χ(1)分布即为
2
τ(, 2)
分布. 现
1
2
X i
N (0,1),由定义X
2i
X (1), 即
2
X i 2
τ(, 2)
12
,i =1,2,
, n . 再由X 1, X 2, , X n 的独
22X , X , 12立性知2
X n
相互独立,从而由τ分布的可加性(见第三章§ 5 例3)知
χ=∑X i 2τ(,2),
2
i =1
n
n
2
(2.3)
2χ即得的概率密度如(2.2)式所示.
根据τ分布的可加性易得χ分布的可加性如下:
2
χ2分布的可加性 设χ12
2
χ2(n 1) ,χ2
2
χ2(n 2) ,并且χ12,χ2
独立,则有
2
χ12+χ2
χ2(n 1+n 2). (2.4)
χ2分布的数学期望和方差 若χ2χ2(n ) ,则有
E (χ2)=n , D (χ2) =2n . (2.5)
X i
N (0,1),故
事实上,因
E (X i 2) =D (X i ) =1
2
D (X i 2) =E (X i 4) -⎡E (X ) ⎤i ⎣⎦=3-1=2, i =1, 2,
2
, n
.
⎛n 2⎫n
E (χ) =E ∑X i ⎪=∑E (X i 2) =n ,
⎝i =1⎭i =1⎛n 2⎫n 2
D (χ) =D ∑X i ⎪=∑D (X i 2) =2n .
⎝i =1⎭i =1
2
χ2分布的分位点 对于给定的正数a ,0
2
P {χ2>χa (n ) }=⎰
∞
2
χa (n )
f (y ) dy =a
(2.6)
2
χ(n ) 为χ2(n ) 分布上的a 分位点,如图6—2所示. 对于不同的a ,n 上a 分位点的值的点a
χ(25)=34.382. 但
已制成表格,可以查用(参见附表4). 例如对于a =0.1,n =25,查得0.1
该表只详列到n =25为止,费歇(R.A.Fisher) 曾证明,当n 充分大时,近似的有
2
2χa (n ) ≈(z a 2
1
2
, (2.7)
图6—2
2
z n >45时χ(n )a a 其中是标准正态分布的上分位点. 利用(2.7)式可以求得当分布的上a
分位点的近似值.
例如,由(2.7
)式可得
2χ0.05(50)=67.505).
2
χ0.05(50)≈(1.6452=67.221
1
2
(由更详细的表得
(二)t 分布 设X
N (0,1),Y
2χ(n ),且X,Y 独立,则称随机变量
t =
(2.8)
服从自由度为n 的t 分布. 记为t t (n ) .
t 分布又称学生氏(Student )分布. t 分布的概率密度函数为
t 2-(n +1)h (t ) =+) , -∞
n
(2.9)
图6—3
(证略). 图6—3中画出了h (t ) 的图形. h (t ) 的图形关于t =0对称,当n 充分大时其图形类似于标准正态变量概率密度的图形. 事实上,利用τ函数的性质可得
lim h (t ) =
n →∞
-t 2 (2.10)
故当n 足够大时t 分布近似于N (0,1)分布. 但对于较小的n ,t 分布与N (0,1)分布相差较大(见附表2与附表3).
t 分布的分位点 对于给定的a ,0
P {t >t a (n ) }=⎰
∞
t a (n )
h (t ) dt =a
(2.11)
的点
t a (n ) 为t(n ) 分布的上α分位数(如图6—4).
图6—4
由t 分布α分位点的定义及h (t ) 图形的对称性知
t 1-α(n ) =-t α(n ) (2.12)
t 分布的上α分位点可自附表3查得. 在n >45时,对于常用的α的值,就用正态近似:
t α(n ) ≈z α (2.13)
U (三)F 分布 设
χ2(n 1), V
χ2(n 2) ,且U ,V 独立,则称随机变量
F =
U n 1
V n 2 (2.14)
服从自由度为
(n 1, n 2) 的F 分布,记为F F (n 1, n 2) .
F (n 1, n 2) 分布的概率密度为
n 12(n 2-1
⎧τ(y [n 1+n 22(]n 1n 2)
, y >0, ⎪(n 1+n 22)
ϕ(y ) =⎨τ(n 12) τ(n 22) [1+(n 1y n 2) ](
⎪
0, 其它⎩ (2.15)
(证略).
图6—5中画出了ϕ(y ) 的图形.
由定义可知,若
F
F (n 1, n 2) ,则
1
F
F (n 2, n 1)
(2.16)
图6—5
F 分布的分位点 对于给定的a ,0
P {F >F α(n 1, n 2) }=⎰
∞
F α(n 1, n 2)
ϕ(y ) dy =α
(2.17)
的点
F α(n 1, n 2) 为F (n 1, n 2) 分布的上α分位点
(图6—6). F 分布的上α分位点(图6—6). F
分布上α分位点有表格可查(见附表5).
图6—6
F 分布的上α分位点有如下的重要性质:
F 1-α(n 1, n 2)=
1
F α(n 2, n 1) (2.18)
(2.18)式常用来求F 分布表中未列出的常用的上α分位点. 例如,
F 0.95(12,9)=
11
==0.357
F 0.05(9,12)2.80
(四)正态分布的样本均值与样本方差的分布 设总体X (不服从什么分布,只要均值和方差存在)的均值为μ,方差为σ,
2
X 1, X 2,
, X n 是来自X 的一个样本,X ,S 2
是样本均值和样本方差,则总有
E (X ) =μ, D (X ) =α2 (2.19)
而
2⎫⎤⎡1⎛n 2
E (S ) =E ⎢X -nX ∑i ⎪⎥n -1i =1⎝⎭⎦⎣
2⎤1⎡n 2
=E (X ) -nE (X ) ⎥∑i ⎢n -1⎣i =1⎦
2
1⎡n 2222⎤=(σ+μ) -n (σn +μ) ⎥∑n -1⎢⎣i =1⎦=σ2
,
22
E (S ) =σ即 . (2.20)
进而,设X
1n
X =∑X i
N (μ, σ2) ,由第四章§n i =1也服从正态分布,于 2(2.8)式知
是得到以下的定理:
X , X , 定理一 设12, X n 是来自正态总体N (μ, σ2) 的样本,X 是样本均值,则有
X
N (μ, σ2) .
2N (μ, σ) 的样本均值X 和样本方差S 2,有以下两个重要的定理. 对于正态总体
X , X , 定理二 设12
方差,则有
, X n 是总体N (μ, σ2) 的样本,X ,S 2分别是样本均值和样本
(n -1) S 2
1︒
σ
2
χ2(n -1)
2︒X 与S 独立 (2.21)
定理的证明见本章末附录.
2
X , X , 定理三 设12, X n 是总体N (μ, σ2) 的样本,X ,S 2分别是样本均值和样本
方差,则有
证 由定理一、定理二
t (n -1)
(2.22)
且两者独立. 由t 分布的定义知
N (0,1)
,
(n -1) S 2
σ
2
χ2(n -1)
,
化简上式左边,即得(2.22)式.
t (n -1)
.
对于两个正态总体的样本均值和样本方差有以下的定理.
定理四 设
X 1, X 2,
X n 1
与
Y 1, Y 2, Y n 2
2
N (μ, σ11) 与分别是来自正态总体
N (μ2, σ22) 的样本,且这两个样本相互独立. 设
S 12=
个样本的样本均值;样本的样本方差,则有
2
S 12S 2
X =
1n 11n 2
X ,Y =∑i n ∑i =1Y i
n 1i =12分别是这两
1n 11n 2222
(X -X ) S =(Y -Y ) ∑∑i =1i i 2
n 1-1i =1n -12,分别是这两个
1 σ
︒
2
1
22
F (n 1-1, n 2-1)
;
222
2︒ 当σ1=σ2=σ时,
t (n 1+n 2-2)
,
2
(n 1-1) S 12+(n 2-1) S 2S =, S w =n 1+n 2-2其中
2
w
证 1 由定理二
︒
(n 1-1) S 12
σσ
21
χ2(n 1-1) χ2(n 2-1)
.
2
(n 2-1) S 2
22
22S S 12由,假设独立,则由F 分布的定义知
(n 1-1) S 12
(n 1-1) σ21
即
2
(n 2-1) S 2(n 2-1) σ22
F (n 1-1, n 2-1)
.
2
S 12S 2
σ2122
F (n 1-1, n 2-1)
.
2 易知
︒
X -Y
N (μ1-μ2+)
n 1n 2,即有
σ2σ2
U N (0,1)
又由给定条件知
(n 1-1) S 12
σ
2
χ(n 1-1)
2
2
(n 2-1) S 2
,
σ
2
χ2(n 2-1)
,
2χ且它们相互独立,故由分布的可加性知
V =
(n 1-1) S 12
σ2
+
2
(n 2-1) S 2
σ2
χ2(n 1+n 2-2)
.
由本章附录2知U 与V 相互独立. 从而按t 分布的定义知
︒
=
t (n 1+n 2-2)
本节所介绍的几个分布以及四个定理,在下面各章中都起着重要作用. 应注意,它们都是在总体为正态这一基本假设下得到的.
小结
在数理统计中往往研究有关对象的某一项数量指标,对这一数量指标进行试验或观察,将试验的全部可能的观察值成为总体,每个观察值称为个体,总体中的每一个个体是某一随机变量x 的值,因此一个总体对应一个随机变量x . 我们将不区分总体与相应的随机变量x ,笼统称为总体x . 随机变量x 服从什么分布,就称总体服从什么分布. 在实际中遇到的总体往往是有限总体,它对应一个离散型随机变量. 当总体中包含的个体的个数很大时,在理论上可以认为它是一个无限总体. 我们说某种型号的灯泡寿命总体服从指数分布,是指无限总体而言的. 又如我们说某一年龄段的男性儿童的身高服从正态分布,也是指无限总体而言的. 无限总体使人们对具体事物的抽象. 无限总体的分布形式较为简明,便于在数学上处理,使用方便.
在相同的条件下,对总体x 进行n 次重复的、独立的观察,得到n 个结果称随机变量
X 1, X 2,
X n ,
X 1, X 2,
X n 为来自总体x 的简单随机样本,它具有了两条性质.
1、
X 1, X 2,
X n 都与总体具有相同的分布; X n 相互独立.
2、
X 1, X 2,
我们就是利用来自样本的信息推断总体,得到有关总体分布的种种结论的.
样本
X 1, X 2,
X n 的函数g (X 1, X 2, , X n ) ,若不包含未知参数,则称统计量. 统计量
是一个随机变量,它是完全是有样本所确定的. 统计量四进行统计推断的工具. 样本均值
1n
X =∑X k
n k =1
和样本方差
1n
S =(X k -X ) 2∑n -1k =1
2
是两最重要的统计量. 统计量的分布称为抽样分布. 下面是三个来自正态分布的抽样分布:
χ2分布,t 分布,F 分布
这个三个分布统称为统计学的三大分布,它们在数理统计中有着广泛的应用. 对于这三个分布,要求读者掌握它们的定义和密度函数图形的轮廓,还会使用分位点表写出分为点.
2
关于样本均值X 、样本方差S ,有以下的结果.
1. 设
X 1, X 2,
X n 是来自总体X (不管服从什么分布,只要它们的均值和方差存在)
2
的样本,且有E (X ) =μ, D (X ) =σ, 则有
E (X ) =μ, D (X ) =σ2.
2. 设总体X
N (μ, σ2) ,X 1, X 2, X n 是来自X 的样本,则有
︒
1 X
N (μ, σ2)
(n -1) S 2
2
︒
σ2
χ2(n -1)
3 X 与S 相互独立;
︒2
4
︒
t (n -1)
X 3. 对于两个正态总体
重要术语及主题
N (μ1, σ21) ,Y
N (μ2, σ22) ,有定理四的重要结果.
总体 简单随机样本 统计量
χ2分布,t 分布,F 分布的定义及它们的定义和密度函数图形的轮廓
1
F α(n 2, n 1)
上α分位点
F 1-α(n 1, n 2)=
小结中关于样本均值、样本方差的重要结果
附录
1︒定理二的证明
令
Z i =
X i -μ
σ
, i =1, 2, , n ,
则由定理二的假设知,
Z 1, Z 2,
, Z n 相互独立,且都服从
N (0,1)分布,而
1n X -μZ =∑Z i =
n i =1σ;
(n -1) S
2
σ2
n i =1
=
∑(X
i =12
n
i
-X ) 2
σ2
n i =1
⎡(X -μ) -(X -μ) ⎤=∑⎢i ⎥
σi =1⎣⎦
n 2
2
=∑(Z i -Z ) =∑Z i 2-nZ
取一n 阶正交矩阵
A =
(a ij )
,其中第一行元素均为做正交交换
Y =AZ
其中
⎡Y 1⎤⎡Z 1⎤
⎢Y ⎥⎢Z ⎥Y =⎢2⎥, Z =⎢2⎥
⎢⎥⎢⎥⎢⎥⎢⎥Y ⎣n ⎦⎣Z n ⎦.
Y i =∑j =1a ij Z j , i =1, 2,
n
由于
, n
. 故
Y 1, Y 2,
, Y n 仍为正态变量. 由
Z i
N (0,1),i =1,2,
, n 知
n
n
E (Y i ) =E (∑a ij Z j ) =∑a ij E (Z j ) =0
j =1
j =1
又由
Cov (Z i , Z j ) =δij (δij =0当i ≠j ; δij =1, 当i =j ) i , j =1,2,
, n
知
Cov (Y i , Y k ) =Cov (∑a ij Z j , ∑a kl Z l )
j =1
l =1
n n
=∑∑a ij a kl Cov (Z j ,Z l )
j =1l =1n
n n
=∑a ij a kl
j =1
=δik
(由正交矩阵的性质),故
Y 1, Y 2,
, Y n 两两不相关. 又由于n 维随机变量(Y 1, Y 2, , Y n )
是由n 维随机变量(
X 1, X 2,
X n )经由线性变换得到的,因此,Y , Y , (12
Y 1, Y 2,
, Y n 两两不相关可推得Y 1, Y 2, , n . 而
n
, Y n )也是n 维
随机变量(参见第136页). 于是由见第136页),且有
, Y n 相互独立(参
Y i
N (0,1),i =1,2,
Y 1=∑a 1j Z j =j =1
j =1
n
j
n
∑Y
i =1
n
2
i
=Y 'Y =(AZ ) '(AZ ) =Z '(A 'A ) Z =Z 'IZ =Z 'Z =∑Z i 2
i =1
,
于是
(n -1) S 2
σ2
=∑Z -nZ =∑Y i -Y =∑Y i 2
2
i
2
21
i =1
i =1
i =1
n
2
n n
.
Y , 由于2Y n 相互独立,且Y i
N (0,1),i =1,2,
, n 知∑i =2Y i
n
2
χ2(n -1)
. 从而证得
(n -1) S 2
σ2
χ2(n -1)
X =σZ +μ=
再者,与S 相互独立.
2
+μ
仅依赖于
Y 2, Y 3,
, Y n . 再由Y 1, Y 2, , Y n 的独立性,
推知X
2︒定理二的推广
定理二中X 与S 相互独立这一结论,还能推广到多个同方差正态总体的情形. 例如,对
22
N (μ, σ) ,N (μ, σ) 的样本均值和样本方差. 只要引入正交矩阵 12于两个同方差正态总体
2
⎛A T = 1
⎝00⎫⎪A 2⎭
,
其中向量
A i 为n i 阶正交矩阵,
其第一行元素都等于i =1, 2)
,与上面同样的做法,即考察
Z =TV
各分量的独立性,其中
V '=(V 1, V 2, , V n )
, n 1
, n 2, n 1+n 2=n
V i =(X i -μ1), i =1, 2,
V n 1+j =(Y i -μ2) , j =1, 2,
2
X ,Y ,S 12,S 2
就可以证得相互独立.
X , S
一般,对于m (m >2) 个同方差的正态总体的情形,设i i 分别是总体
2
N (μi , σ2), i =1,2,
X 1, X 2,
, m 的样本均值和样本方差,且设各样本相互独立,则
2, S m
2
, X m ,S 12, S 2,
相互独立.
习题
2
N (52,6.3) 中随机抽一容量为36的样本,求样本均值X 落在50.8到53.8之1. 在总体
间的概率.
4) 中随机抽一容量为5的样本2. 在总体N (12,
均值之差的绝对值大于1的概率;⑵求概率
X 1, X 2, X 3, X 4, X 5. ⑴求样本均值与总体
;
P {max(X 1, X 2, X 3, X 4, X 5) >15}
P {min(X 1, X 2, X 3, X 4, X 5)
.
3. 求总体N (20,3)的容量分别为10,15的来那个独立样本均值差的绝对值大于0.3的概
率.
4. 设
X 1, X 2,
⎧102⎫P X >1.44⎨⎬∑X 10为N (0,0.32) 的一个样本,求⎩i =1i ⎭.
F (1, n ) .
X n 是来自X 的样本,⑴X , X , 求(12
2
5. 已知X
t (n ) ,求证X 2
6. 设总体
X
b (1, p ) X 1, X 2,
X n )的分布律;
⑵求
∑X
i =1
n
i
的分布律;⑶求E (X ) ,D (X ) ,E (S ) .
X 7. 设总体
8. 设总体X
χ2(n ) ,X 1, X 2,
X 10是来自X 的样本,求E (X ) ,D (X ) ,E (S 2) .
X 10是来自X 的样本,⑴X , X , 写出12
X 10的联
X , X , N (μ,σ2),12
合概率密度;⑵写出X 的概率密度.
22
N (μ,σ)μ,σ9. 设在总体中抽取一容量为16的样本. 这里均为未知. ⑴求
P {S 22≤2.014}D (S 2)
22D (S ) . S ,其中为样本方差;⑵求