概率统计简明教程_第七章_参数估计
第七章 参数估计
统计推断是数理统计的重要内容,它是指在总体的分布完全未知或形式已知而参数未知的情况下,通过抽取样本对总体的分布或性质作出推断.大致可以分为估计问题和假设检验问题两大类.
本章重点介绍参数估计问题,即根据样本对总体分布中所包含的未知参数或总体的数字特征作出数值上的估计.主要内容包括:点估计和区间估计.
§1 点估计概述
1.1
点估计
在许多实际问题中,可以认为总体X分布的形式是已知的,它只依赖于一个或几个未知参数.如果能对分布中所含的参数作出推断,那么就可以确定总体分布.例如, 已知总体服从正态分布N,1,未知,我们的目的是通过样本提供的信息对未知参数作出估计,也就是借助于样本对总体作出推断,这类问题就是参数估计问题.
点估计问题的一般提法是:设总体X的分布函数Fx;类型已知,为未知参数,它的可能取值范围是已知的,称为参数空间,即
.这样,我们有一族分布函数Fx;:.如果
Fx;,:,0是正态分布的分布函数族,其中
2
,2.设X1,X2,,Xn是X的一个样本, x1,x2,,xn为相应的
样本值.我们构造一个统计量X1,X2,,Xn,以X1,X2,,Xn的值
x1,x2,,xn作为参数的真实值的估计.习惯上,称
222
ˆX,X,,X,称X1,X2,,Xn为参数的估计量12nˆx,x,,x.在不致混淆的情况下, x1,x2,,xn为的估计值为12n
估计量与估计值都简称为估计,简记为ˆ.容易看出,对于不同的样本值来说,由同一个估计量得出的估计值一般是不相同的.在几何上一个数值是数轴上的一个点,用的估计值ˆ作为的近似值就像用一个点来估计,故称为点估计.
如果总体分布中含有k个未知参数1,,k,则需要构造k个统计量
ˆX,X,,X,,ˆX,X,,X分别作为,,的估计量. 1k112nk12n
例1.1 设总体X服从参数为的泊松分布, 0为未知参数,现
有以下样本值
3,4,1,5,6,3,8,7,2,0,1,5,7,9,8 试求未知参数的估计值.
1n
解:由于EX,自然地想到用样本均值Xi作为的
ni1
估计量,利用样本值得
1
3415638720157984.6. 15
ˆ与估计值ˆ4.6. 这样,我们获得了参数的估计量
在本例中,对于总体X的一个样本X1,X2,,Xn,Xi1in亦可以作为的估计量;同样地,X1和Xn都应该可作为的估计量.这样,对于同一个参数,可以有许多不同的点估计;在这些估计中,我们自
然地希望挑选一个最“优”的点估计.因此,有必要建立评价估计量优劣的标准.下面介绍几个常用的标准:无偏性、有效性和一致性.
1.2 评价估计量的标准
1. 无偏性
223
ˆˆX,X,,X得出的估计 对于不同的样本值来说,由估计量12n
值一般是不相同的,这些估计只是在参数真实值的两旁随机地摆动.要确定估计量ˆ的好坏,要求某一次抽样所得的估计值等于参数的真实值是
ˆ,这是估计量所应该具有的一种良好性没有意义的,但我们希望E
质,称之为无偏性,它是衡量一个估计量好坏的一个标准.
ˆˆX,X,,X的数学期 定义1.1 如果未知参数的估计量12n
ˆ存在,且对任意,都有 望E
ˆ (1.1) E
则称ˆ是的无偏估计量.
ˆ是以ˆ作为估计的系统误差. 无偏估在科学技术中,称E
计的实际意义就是无系统误差.
例1.2 设X1,X2,,Xn是总体X的一个样本, 总体X的k阶原
1nk
点矩记为kE(X),样本原点k阶矩记为AkXi,证明:Ak是
ni1
k
k的无偏估计量.
证明: X1,X2,,Xn是总体X的一个样本,即X1,X2,,Xn与X同分布,因此 E(Xik)E(Xk)k,i1,2,,n.
1n
即 E(Ak)E(Xik)k .
ni1
例1.3 设总体X的均值和方差都存在,证明:未修正样本方差
2
224
1n
S(Xi)2不是2的无偏估计量.
ni1
20
22
证明: 在第六章第二节中,我们证明了ES,因此,修正的样
1n2
本方差S也就是说S0不是2(Xi)2是2的无偏估计量,n1i1
2
的无偏估计量.
我们以后一般取S2作为2的估计量.
例1.4 设总体XP(),X1,X2,,Xn是X的一个样本, S为
2
样本方差,01,证明:L1S是参数的无偏估计量.
2
证明:易见EEX,ESD(X),
2
ELE1ES2
1,
2
因此,估计量L1S是的无偏估计.
2. 有效性
同一个参数可以有多个无偏估计量,那么用哪一个为好呢?设参数
ˆ和ˆ,在样本容量n相同的情况下, ˆ的观测值都集有两个无偏估计量121ˆ的观测值较远离的真值,即ˆ的方差较ˆ的方中在的真值附近,而212ˆ较ˆ好,由此有如下的定义: 差小,我们认为12
ˆˆX,X,,X和ˆˆX,X,,X都是定义1.2 设1112n2212n
参数的无偏估计量,若对任意,都有
ˆ)D(ˆ) (1.2) D(12
225
ˆ较ˆ有效. 且至少存在一个0使得上式中的不等号成立,则称12
例1.5 设X1,X2,,Xn是总体X的一个样本, X的均值 和方
k
1ˆ差都存在,且0,记Xi,k1,,n.易见, k
ki1
2
2
1k1ˆE(k)E(Xi)k,k1,,n. ki1k
因此, 这些估计量都是的无偏估计量.由于
2k
112ˆ) D(, D(Xi)2kk2ki1kk
ˆ最有效. 从而n
3.一致性
无偏性和有效性都是在假设样本容量n固定的条件下讨论的.由于估计量是样本的函数,它依赖样本容量n,自然地,我们希望一个好的估计量,当n越来越大时,它与参数的真值几乎一致,这就是估计量的一致性或称之为相合性.
ˆˆX,X,,X为参数的一个估计量, n为样定义1.3 设n12n
ˆ依概率收敛于,即对任意0,有 本容量,如果对任意,n
limP
n
ˆ1 (1.3)
n
ˆ为参数的一致估计量. 则称n
2
例1.6 设总体X的均值和方差都存在,证明:样本均值
1n
Xi是的一致估计量.
ni1
证明:由切比雪夫大数定律可知,对任意0,有
226
1n
limPXi1
n
ni1
1n
因此,Xi是的一致估计量.
ni1
例1.7 设总体XN,2,X1,X2,,Xn是总体X的一个样本,
1n
证明: 样本方差S(Xi)2是2的一致估计量. n1i1
2
证明:由于
n1
2
S22n1,
有 D
n12
S2(n1), 2
2
4
2n1222
因此, D(S).由切比雪夫不等式可D2S
n1n1
知,对任意0,有
24
. 0PSE(S)PS2D(S)
(n1)2
22
22
1
2
这样 limPS2E(S2)0,
n
即 limPS221, S是2的一致估计量.
2
n
§2 矩估计与最大似然估计
本节我们介绍两种常用的构造估计量的方法,即矩估计法和最大似然
估计法.
2.1
矩估计法
227
许多总体的未知参数与总体矩之间存在着函数关系,如在泊松总体
P中,它的参数就是总体的一阶矩,又如在正态总体XN,2
中EX,EX
2
2
EX.若总体矩存在,我们很自然地想
2
到用样本矩来估计相应的总体矩,从而可以获得未知参数的估计量,这种方
法称之为矩估计法.
设X1,X2,,Xn是总体X的一个样本,若X是连续型随机变量,则其概率密度函数为fx;;若X是离散型随机变量,则其分布律为
px;,1,2,,k,.假设总体X的k阶原点矩存在,记
1nl
lEX,AlXi,l1,2,,k.由辛钦大数定律可知,Al依
ni1
l
概率收敛于l,即可以用样本矩替换同阶的总体矩,我们称之为替换原则.替换原则是矩估计法的思想实质,这种方法只需假设总体矩存在,无需知道总体的分布类型.由于l依赖于参数1,2,,k,可设
1(1,2,,k)1,(,,,),212k2
k(1,2,,k)k.
将此方程组的解记为
11(1,2,,k),(,,,),2212k
kk(1,2,,k).
用Al替换ll1,2,,k,得到
228
ˆ(A,A,,A),1112k
ˆ(A,A,,A),2212k
ˆ
kk(A1,A2,,Ak).
并把它们分别作为参数1,2,,k的估计量,称之为矩估计量, 矩估计量的观测值称为矩估计值.
例2.1 设总体X的概率密度函数为
1x,0x1,
fx;
0,其他.
1,求参数的矩估计量.
解: 1EX解得
1
1xdx01
1
, 2
211
,
11
ˆ因此, 的矩估计量为
21
.
1如果我们获得一组样本观测值,其样本均值为0.65,则参数的矩估计值为
ˆ
20.651
0.86.
10.65
22
例2.2 设总体X的均值和方差都存在,且0,又设
X1,X2,,Xn是总体X的一个样本,求和2的矩估计量.
解:注意到EX
2
DXEX,由方程组
2
1EX,
222
EX.2
229
解得1,2212.因此,和2的矩估计量分别为
ˆA1,
1n21n2
A2AXi(Xi)2.
ni1ni1
2
21
此例表明, 总体X均值和方差的矩估计量分别是样本均值与样本的二阶中心矩,而不依赖总体X的分布.
2.2 最大似然估计法
由于矩估计法只需假设总体矩存在,没有充分利用总体分布提供的信息,为获得更理想的估计,需要引入最大似然估计法,它的一个直观想法是某个随机试验有若干个结果A,B,C等,如果在一次试验中,出现结果A,则认为事件A发生的概率是最大的.例如,一只袋子里有黑白两种外形相同的球,这两种球的数量不详,只知道它们占总数的比例:一种球为10%,另一种球占90%.今从中任抽取一只球,取得白球,一种比较合理的想法是认为袋子里白球的数量较多, 占总数的90%,这就是最大似然估计法的基本思想.我们通过下面的例子说明最大似然估计法的原理.
某工厂加工一批产品,现需要估计其不合格品率p,今从中抽取一个容量为n的样本值x1,x2,,xn,令
1,第i次取到次品Xi
0,第i次取到正品
总体X的分布律为
i1,2,,n,
px;ppx1p
取得样本获得观测值的概率为
1x
,x0,1.
PX1x1,X2x2,,Xnxnpx11p
n
1x1
pxn1p
n
1xn
xnx
pi1i1pi1i
,
xi0,1i1,2,,n.显然PX1x1,X2x2,,Xnxn是p的函
230
数,记为Lp,即
xnx
Lppi1i1pi1i.
n
n
由于在一次取样中,样本值x1,x2,,xn出现,我们认为概率Lp是
ˆ作为参数p的一个估计值,即最大的,选取使得Lp达到最大的p
ˆmaxLp.由微积分中求极大点的方法, p可从方程Lp
p
dLp
0求出,又由于lnx是x的单调增函数,lnLp与Lp在同一dp
dlnLp
个p处取极大值,p也可从方程0求出,
dp
lnLpi1xilnpni1xiln1p,
dlnLp
dp
n
n
i1xi
p
n
ni1xi
1p
n
0,
ˆ解得: p
n
i1i
x
n
.
ˆ容易验证, p
n
i1i
x
n
能使得Lp达到最大,称之为参数p的最大似
然估计值,其对应的统计量称为参数p的最大似然估计量.下面我们讨论最大似然估计法.
设X1,X2,,Xn是取自总体X的一个样本, x1,x2,,xn为样本值.如果总体X是离散型的,其分布律为px;,为未知参数,. 样本X1,X2,,Xn的联合分布律为
231
PX1x1,X2x2,,Xnxnpxi;,
i1
n
容易看出,当样本值x1,x2,,xn固定时上式是参数的函数,当取固定值时,上式是事件X1x1,X2x2,,Xnxn发生的概率,记
LL;x1,x2,,xnpxi; , (2.1)
i1
n
并称L为样本的似然函数.若样本值x1,x2,,xn的函数
ˆˆx,x,,x满足 12n
ˆmaxL, (2.2) L
ˆˆx,x,,x为的最大似然估计值,其相应的统计量则称12nˆX,X,,X称为的最大似然估计量. 12n
如果总体X是连续型的,X的概率密度为fx;,为未知参数,.随机点(X1,X2,,Xn)落在点(x1,x2,,xn)的边长为
x1,x2,,xn的邻域内的概率近似为fxi;xi.我们寻找使
i1
n
fxi;xi达到最大的ˆˆx1,x2,,xn,但xi与它无关,故
i1
i1
nn
可取样本的似然函数为
LL;x1,x2,,xnfxi;. (2.3)
i1
n
ˆˆx,x,,x满足 类似地, 若样本值x1,x2,,xn的函数12n
232
ˆmaxL L
ˆˆx,x,,x为的最大似然估计值,其相应的统计量则称12nˆX,X,,X称为的最大似然估计量. 12n
获得样本的似然函数后,为求出未知参数的最大似然估计量,可以
利用微积分中求函数极值的方法.
假设fx;或px;关于可微,由下面的似然方程
dL
d
0, 或对数似然方程
dlnL
d
0,
可求出最大似然估计.
例2.3 设总体XP,求的最大似然估计量.
n
e解:似然函数为 Lxi
i1
x ,
i!nn
对数似然函数为 lnLln
xi
nln(xi
!),
i1
i1
n
令
dlnLxi
di1
n0, n
求得的最大似然估计值为 1nxi
, i1n
最大似然估计量为1nXi
. i1
233
例2.4 总体XE,求的最大似然估计量.
ex,x0
解: 总体X的概率密度为fx,.
x00,
似然函数为 L
e
i1
n
xi
e
n
xi
i1
n
,
对数似然函数为lnLnln
x,
ii1
n
dlnLn
0,有xi0, 令
dni1因此,的最大似然估计值为
n
i
x
i1
n
11. ,最大似然估计量为
假设总体的分布中含有k个未知参数1,2,,k,类似地,写出似然函数LL1,2,,k,求解方程组
L
0i1,2,,k i
或
lnL
0i1,2,,k i
可获得未知参数1,2,,k的最大似然估计.
22
例2.5 总体XN,,求,的最大似然估计量.
解: 似然函数为 L
,
2
1
2
n22
1nexp2(xi)2
2i1
234
nn1
对数似然函数为lnL,ln2ln2
2222
2
(x)
i
i1
n
2
分别求关于和2的偏导数,得以下对数似然方程组
lnL,21n
2(xi)0,
i1
2
lnL,n1n
24(xi)20.2
22i1
解上述方程组得和2的最大似然估计值分别为
1n
ˆxi ,
ni121(x)2, i
ni1
21(X)2. ˆ和因此和的最大似然估计量分别为i
ni1
2
n
n
最大似然估计具有一个性质:如果ˆ为总体X未知参数的最大似然估计,函数
ˆ为ˆ具有单值反函数,则
的最大似然估计.利用此性质,我们可获得例2.5中的最大似
然估计量为
ˆ例2.6 设总体X服从0,上的均匀分布,0,求的最大似然估计值.
解:记x1minx1,,xn,xnmaxx1,,xn.
235
1
,0x1,xn
似然函数为 Ln
其他0,
注意到对于0x1,xn有 0L
1
n
1
. xnn
ˆx. 因此,取的最大似然估计值为n
最后我们给出求最大似然估计的一般步骤(有时候它并不适用,如上
例):
1、写出似然函数L(),即由总体分布导出样本的联合分布律(或联合概率密度);
2、令
dLL
0或0i1,2,,k,求出驻点(常转化为求对di
lnL()的驻点:令
数似然函数
dlnL
0d
或
lnL
0i1,2,,k); i
3、求出最大值点;
4、求得参数的最大似然估计.
§3 区间估计
参数的点估计实质是用一个估计值来估计未知参数的真值,但估计值只是的一个近似值,它本身既没有反映这种近似的精度又没有给出误差的范围,因此,在实际问题的应用中意义有限.例如在一大批产品中,任意取出60件产品,经检验有3件为次品,按点估计的方法,我们获得次品率p
ˆ=0.05,但pˆ与次品率p的真值是有误差的,这个误差有的一个估计值为p
236
ˆ,pˆ,用它多大,点估计无法给予回答.我们希望给出一个区间p
来估计次品率p的真值,这样就产生了误差的大小及用区间
ˆ,pˆ估计次品率p真值的可靠程度的问题.区间估计解决了上p
述问题,我们将介绍在区间估计理论中被广泛接受的置信区间.
3.1 置信区间
定义3.1设X1,,Xn是取自总体X的一个样本, 为总体分布中所含的未知参数, .对于给定的,01,若存在两个统计量
X1,,Xn和X1,,Xn,使得
P1 (3.1)
则称随机区间,是的臵信水平为1的臵信区间,和分别称为的臵信下限和臵信上限.
定义3.1表明置信区间,包含的真值的概率为1,它的两个端点是只依赖X1,X2,,Xn的随机变量.设x1,x2,,xn为一个样本值,我们获得一个普通的区间(x1,x2,,xn,x1,x2,,xn)称之为置信区间,的一个实现,在不致引起误解的情形下,也简称为置信区间.对于一个实现,只有两种可能, 它要么包含的真值,要么不包含的真值.在重复取样下(各次取样的样本容量均为n),我们获得许多不同的实现,根据伯努利大数定律,这些不同的实现中大约有100(1)%的实现包含的真值,而有100%的实现不包含的真值.
2
例3.1 已知某产品的重量(单位:克)XN,
,其中
8,未知,现从中随机抽取9个样品,其平均重量为575.2克,试
237
求该产品的均值的臵信水平为95%的臵信区间.
1n
解:样本均值Xi是未知参数的较优的点估计,同时有
ni1
2N,, 或
N0,1.
n
因此,
我们构造一个枢轴量U
选取区间u/2,u/2,使得
Pu/2u/21,
即
Pu/2u/21.
这样我们得到的置信水平为1的置信区间为
uu/2/2.
由575.2,n9,8,1=95%,0.05,u/2=1.96算得
u/2
575.21.96
569.976 580.424 u/2
575.21.96所以,的一个置信区间为569.976,580.424.
从此例可以看出, 寻求未知参数的置信区间的步骤为:
ˆˆX,X,,X,一般是通过(1) 选取的一个较优的点估计12n
238
最大似然估计法获得.
ˆˆX,,X为基础, 寻求未知参数的一个枢轴量W,(2) 以1n
即WWX1,,Xn;且W的分布已知.
(3)对于给定的置信水平(与无关)1,确定两个分位点a,b,使得
PaWX1,,Xn;b1.
a,b可通过PWX1,,Xn;aPWX1,,Xn;b
确定.
(4)求出的置信区间.
2
3.2 单个正态总体均值与方差的置信区间
以下我们将讨论正态总体的均值与方差的置信区间.设
XN,2,X1,X2,,Xn是取自总体X的一个样本.
1. 参数的置信区间
关于参数的置信区间,我们分方差已知和未知两种情形. (1) 方差2已知的情形
例3.1中,我们已经获得了在方差已知的条件下, 的置信区间为
2
2
2
,
简记为uuu/2/2/2.
(2) 方差未知的情形
由于U
2
22
,又S是的无偏估计量,因此,选取
239
随机变量T
作为枢轴量.由第六章定理4.1可知Tt(n1),对
于给定的置信水平1,有
Pt/2(n1)t/2(n1)1,
即
Pt/2(nt/2(n1,
因此,的置信水平为1的置信区间为
(3.2)
t(nt(n/2/2,
简记为t/2(n. 2
例3.2 假设轮胎的寿命XN(,).为估计它的平均寿命,现随机抽取12只,测得它们的寿命为(单位:万千米)
4.68 4.85 4.32 4.85 4.61 5.02 5.20 4.60 4.58 4.72 4.38 4.70 求的臵信水平为0.95的臵信区间.
2
解:n12, x4.7092,s0.0615,1=95%,0.05,
t0.025112.2010算得的置信水平为0.95的置信区间为
xt11xt11
0.0250.0254.5516,4.8668.
2. 参数的置信区间 (1) 均值已知的情形
2
由于XiN,
2
i1,2,,n,即XN0,1,
i
240
所以
i1
n
Xi
2
2
2n.
1
Xi2
i1n
2
我们选取随机变量平1,有
作为枢轴量, 对于给定的置信水
1n222
P1/2(n)2Xi(n)1, /2
i1
即
n
n22
XXii1i2i1
P1. 22
(n)(n)/21/2
因此,2的置信水平为1的置信区间为
n
n22
XXiii1i1. ,(3.3) 22
(n)(n)/21/2
我们也得到的置信水平为1的置信区间为
(2) 均值未知的情形
由于
. (3.4)
2
1
n1S22
Xn1,选取随机变量i22
n
2
i1
2作为枢轴量,类似地, 我们得到2的置信水平为1的置信区间为
241
n22n
XXin1S2n1S2i
i12,即2,i12,2, /2(n1)1/2(n1)/2(n1)1/2(n1)
和的置信水平为1的置信区间为
, (3.5)
. 即
例3.3 在例3.2中,求2的臵信水平为0.95的臵信区间.
2
解:n12, x4.7092,s0.0615,n1s0.6765
2
1=95%,0.05,20.0251121.920,20.975113.816
算得2的置信水平为0.95的置信区间为(0.03086,0.17728).
3.3 两个正态总体均值差与方差比的置信区间
22
设XN1,1,YN2,2,从总体X和Y中,分别独立地
取出样本X1,X2,,Xn和Y1,Y2,,Ym,样本均值依次记为和,样本
2
方差依次记为S12和S2.
2 1. 设12和2已知,求12的置信区间
242
由第六章定理2.2可知
U
的置信水平1,有
N0,1.对于给定
Pu/2u/21,
即
Pu/12u/1,
因此,12的置信水平为1的置信区间为
u/u/ . (3.6)
例3.4 分别从XN1,4,YN2,6中独立地取出样本容量为16和24的两样本,已知16.9,15.3,求12的臵信水平为
0.95的臵信区间.
解:n16,m24, 16.9,15.3,1=95%,0.05,
2
124,26,u/2u0.0251.96,因此12的置信水平为0.95
的
置信区间为
16.915.31.9615.31.960.214,2.986由此可以认为,在置信水平为0.95的情形下12.
2
2. 设1222未知,求12的置信区间
243
记S
2w
2
n1S12m1S2,由第六章定理4.2可知
nm2
T
tnm2.
以T为枢轴量,类似地,我们得到12的置信水平为1的置信区间为
tnm2Stnm2S
/2/2 (3.7) 例3.5 为了估计磷肥对某农作物增产的作用,现选用20块条件大致相同的地块进行对比试验.其中10块地施磷肥,另外10块地不施磷肥,得到单位面积的产量如下(单位:公斤):
施磷肥:620, 570, 650, 600, 630, 580, 570, 600, 600, 580; 不施磷肥:560, 590, 560, 570, 580, 570, 600, 550, 570, 550.
2
设施磷肥的地块的单位面积的产量XN1,,不施磷肥的地块2
的单位面积的产量YN2,,求12的臵信水平为0.95的臵信
区间.
解:nm10,1=95%,0.05,600,570,
22
6400224002n1s1m1s2
s,s2,sw222,
99nm22
1
t0.025(18)2.1010.因此,12的置信水平为
0.95的置信区间为
600570222.1010570222.1010 (9.23,50.77),
即我们可以认为磷肥对此农作物增产有作用.
244
12
3. 设1和2已知,求2的置信区间
2
因为
i1
n
Xi1
12
2
2
n
,
i1
m
Yi2
22
2
2m且样本
X1,X2,,Xn与样本Y1,Y2,,Ym独立,所以有
F
mn
2221
(X
i1m
i
i1
n
i
1)2
22
(Y)
Fn,m,
对于给定的置信水平1,有
PF1/2(n,m)FF/2n,m1,
即
nn
22m(X)m(X)i1i11211i1i1P1,mm2
Fn,mF(n,m)n(Y)221/2/2n(Yi2)2i2i1i1
12
因此,2的置信水平为1的置信区间为
2
nn
22m(X)m(X)i1i111i1i1. (3.8) ,mm
F/2n,mn(Y)2F1/2(n,m)n(Y)2
i2i2i1i1
12
4.设1和2未知,求2的置信区间
2
2
S122
由于F22Fn1,m1,对于给定的置信水平1,有
S21
245
PF1/2(n1,m1)FF/2n1,m11,
即
S1212S1211P2221, F/2n1,m1S22F1/2(n1,m1)S2
12
从而2的置信水平为1的置信区间为
2
S12S1211
. (3.9) 2Fn1,m1S2,Fn1,m1S221/2/2
例3.6 某车间有甲,乙两台机床加工同类零件,假设此类零件直径服
从正态分布.现分别从由甲机床和乙机床加工出的产品中取出5个和6个,进行检查,得其直径数据(单位:毫米)为
甲: 5.06, 5.08, 5.03, 5.00, 5.07;
乙: 4.98, 5.03, 4.97, 4.99, 5.02, 4.95;
2甲
试求2的臵信水平为0.95的臵信区间.
乙
解: n5,m6,1=95%,0.05,
22s甲0.00107,s乙0.00092,F0.0254,57.39,
2
甲1
0.1068,因此2的置信水平为于F0.9754,5
F0.0255,49.36乙
1
0.95的置信区间为
10.0010710.00107,0.15738,10.8899.
0.000927.390.000920.1068
3.4 单侧置信区间
前面讨论的参数的置信区间,是双侧置信区间,即有置信上限
246
和置信下限.有时在一些实际问题中,我们只关心参数的上限或下限,
因此有必要讨论参数的单侧置信区间.
定义3.2设X1,,Xn是取自总体X的一个样本, 为总体分布中所含的未知参数, .对于给定的(01),若存在统计量
X1,,Xn或X1,,Xn,使得
P1 (3.10)
或
P1 (3.11)
则称随机区间,(或,)是的臵信水平为1的单侧臵信区间,称为的单侧臵信下限(称为的单侧臵信上限).
求参数的单侧置信区间的方法与求的置信区间,的方法是类似的,只需将步骤(3)中的PaWX1,X2,,Xn;b1改为
PaWX1,,Xn;1或PWX1,,Xn;b1,
其中,a,b可通过
PWX1,,Xn;aPWX1,,Xn;b 确定.
详细的结果看表7.2.
例3.7 在例3.2中,求的臵信水平为0.95的单侧臵信下限.
2
解:n12, x4.7092,s0.0615,1=95%,0.05,
t0.05111.7960算得的置信水平为0.95的单侧置信下限为
xt0.05
11
247
4.5806.
248
表7.2 正态总体均值,方差的单侧置信上、下限
249
250
习题七
( A )
1、设总体X服从参数为N和p的二项分布,X1,X2,,Xn为取自
X的一个样本,试求参数p的矩估计量与极大似然估计量.
2,、设X1,X2,,Xn为取自总体X的一个样本,X的概率密度为
2x
,0x
其中参数0,求的矩估计. f(x;)2
其它.0,
3、设X1,X2,,Xn总体X的一个样本, X的概率密度为
x1ex,
f(x;)
0,
x0,
x0
其中0是未知参数,0是已知常数,求的最大似然估计.
4、设总体X服从几何分布 P(Xk)p(1p)
k1
,k1,2,,0p1,
试利用样本值x1,x2,,xn,求参数p的矩估计和最大似然估计. 5、设总体X的概率密度为fx;
1x
exp,0为未知2
参数, X1,X2,,Xn为总体X的一样本,求参数的最大似然估计.
6、证明第5题中的最大似然估计量为的无偏估计量.
xx2e2,x0,22
7,、设总体X的概率密度为fx;,0
0,其它.
为未知参数, X1,X2,,Xn为总体X的一个样本,求参数的的矩估
2
2
251
计量和最大似然估计量.
8、设总体X~N(,2),已知,为未知参数, X1,X2,,Xn为X的一个样本,c|Xi|, 求参数c,使为的无偏估计.
i1n
ˆ)0,试证ˆ2(ˆ)2不是9、设ˆ是参数的无偏估计量,且有D(
2的无偏估计量.
10、设总体X~N(,2),X1,X2,X3是来自X的样本,试证:估计量
131115ˆ2X1X2X1X2X3X3;51023412
111ˆ3X1X2X3 362
都是的无偏估计,并指出它们中哪一个最有效. ˆ1;
2211,、设X1,X2,,Xn是总体XN0,的一个样本,0,证
1n22明:Xi是的相合估计量. ni1
12、设总体X的数学期望为,方差为,分别抽取容量为n1和n2的两个独立样本,1,2分别为两样本均值,试证明:如果a,b满足2ab1,则Y12是的无偏估计量,并确定a,b,使得DY最小.
13、设X1,X2,,Xn是总体X的一个样本, X的概率密度为fx;,0,未知,已知222n,试求的置信水平为1
的置信区间.
14、从大批彩色显像管中随机抽取100只,其平均寿命为10000小时, 252
可以认为显像管的寿命X服从正态分布.已知均方差40小时,在置信水平0.95下求出这批显像管平均寿命的置信区间.
15、设随机地调查26年投资的年利润率(%),得样本标准差S15(%),设投资的年利润率X服从正态分布,求它的方差的区间估计(置信水平为0.95).
16,、从一批钉子中抽取16枚,测得其长度为(单位:厘米)2.14, 2.10,
2.13, 2.15, 2.13, 2.12, 2.13, 2.10, 2.15, 2.12, 2.14, 2.10, 2.13,
2.11, 2.14, 2.11.设钉子的长度X服从正态分布,试求总体均值的置信水平为0.90的置信区间.
17、生产一个零件所需时间(单位:秒)X~N(,2),观察25个零件的生产时间得5.5,s1.73.试求和2的置信水平为0.95的置信区间.
18、产品的某一指标X~N(,2),已知0.04,未知.现从这批产品中抽取n只对该指标进行测定,问n需要多大,才能以95%的可靠性保证的置信区间长度不大于0.01?
19、设A和B两批导线是用不同工艺生产的,今随机地从每批导线中抽取5根测量其电阻,算得sA1.0710,sB5.310,若A批导线的电阻服从N(1,1),B批导线的电阻服从N(2,2),求12的置信水平为0.90的置信区间.
20,、从甲乙两个蓄电池厂的产品中分别抽取6个产品,测得蓄电池的容量(A.h)如下:
甲厂 140 , 138 , 143 , 141 , 144 , 137;
乙厂135 , 140 , 142 , 136 , 138 , 140
设蓄电池的容量服从正态分布,且方差相等,求两个工厂生产的蓄电池的容量均值差的95%置信区间.
22222726
( B )
1、设总体X的概率分别为
253
其中0
1是未知参数,利用总体X的如下样本值: 2
3, 1, 3, 0, 3, 1, 2, 3
求的矩估计值和最大似然估计值.
ˆˆX,,X和ˆˆX,,X是参数的两个相 2、设 111n221n
ˆ2Dˆ,试确定常数a,b,使得互独立的无偏估计量,且方差D12
ˆbˆ是的无偏估计量,且在一切这样的线性估计类中方差最小. a12
3、在测量反应时间中,一心理学家估计的标准差为0.05秒,为了以0.95的置信水平使他对平均反应时间的估计误差不超过0.01秒,应取多大的样本容量.
【提供者:路磊】
254