数理统计课件 贝叶斯估计2
四.贝叶斯估计
1.贝叶斯点估计
定义3.6 设总体X的分布函数为F(x,θ),θ为随机变量,若在决策空间π(θ)为θ的先验分布。
D中存在一个决策函
数d*(X),使得对决策空间D中任一决策函数d(X),均有 R(d*)=infR(d),∀d∈D (下确界)
d
则称d*(X)为参数θ的贝叶斯估计量。
由定义可见,贝叶斯估计量d*(X)就是贝叶斯风险
R(d)达到最小的决策函数。
即对于不注意,贝叶斯估计量依赖于先验分布π(θ),在常用损失函数同的π(θ),θ的贝叶斯估计量是不同的,下,贝叶斯估计有如下几个结论。
定理3.2 若给定θ的先验分布π(θ)和平方损失函数
L(θ,d)=(θ−d)
2
则θ的贝叶斯估计是 d(x)=E(θ|X=x)=∫Θθh(θx)dθ 其中h(θx)为参数θ的后验密度。
证明 由于
R(d)=∫m(x)
χ
{∫Θ[θ−d(x)]
2
2
h(θx)dθdx=min
}
与∫Θ[θ−d(x)]h(θx)dθ=mina.s(几乎处处)
是等价的。而
∫
Θ
[θ−d(x)]h(θx)dθ
2
2
=∫⎡θ−E(θx)+E(θx)−d(x)⎤⎦h(θx)dθ Θ⎣
θ−E(θx)⎤=∫⎡⎦h(θx)dθ+∫Θ⎡⎣E(θx)−d(x)⎤⎦h(θx)dθΘ⎣θ−E(θx)⎤+2∫⎡⎦⎡⎣E(θx)−d(x)⎤⎦h(θx)dθ,Θ⎣
22
其中 E(θ|x)=∫Θθh(θ|x)dθ.
又 ∫Θ⎡⎣θ−E(θx)⎤⎦⎡⎣E(θx)−d(x)⎤⎦h(θx)dθ
=⎡⎣E(θx)−d(x)⎤⎦∫Θ⎡⎣θ−E(θx)⎤⎦h(θx)dθ
=[E(θx)−d(x)][E(θx)−E(θx)]=0,
故 ∫Θ[θ−d(x)]h(θx)dθ
=∫⎡θ−E(θx)⎤⎦h(θx)dθ+∫Θ⎡⎣E(θx)−d(x)⎤⎦h(θx)dθ Θ⎣
2
2
显然,当d(x)=E(θx) a.s 时,R(d)达到最小。 定理3.3 设θ的先验分布为π(θ),取损失函数为加权平方损失函数 L(θ,d)=λ(θ)(d−θ) 则θ的贝叶斯估计为d*(x)=
E[λ(θ)⋅θx]
,这里略去不证。
E[λ(θ)x]
T
2
定理3.4 设参数θ为随机向量,θ=(θ1,",θp),对给定的先验分布π(θ)和二次损失函数
L(θ,d)=(d−θ)TQ(d−θ)
其中Q为正定矩阵,则θ的贝叶斯估计为后验分布h(θx)
⎡E(θ1x)⎤
的均值向量,即 d*(x)=E(θx)=⎢#⎥
⎣E(θpx)⎦
这个结论表明,在正定二次损失下,θ的贝叶斯估计不受正定矩阵Q的选取的干扰,这一特性常被称为θ的贝叶斯估计关于Q是稳健的。
证明 在二次损失下,任一个决策函数向量
d(x)=d1(x),",dp(x)
()
T
的后验风险为(θ的条件期望)
E[(d−θ)Q(d−θ)x]
=E[((d−d*)+(d*−θ))Q((d−d*)+(d*−θ))x]
T
T
=(d−d*)Q(d−d*)+E[(d*−θ)Q(d*−θ)x]
TT
上述最后一个等式应有四项,但由于E[(d*−θ)x]=0,从而只有此结果。上式的第二项为常量,而第一项非负,故使上式最小仅需d=d*(x)即可. 证毕.
定义3.7 设d=d(x)为决策类D中任一个决策函则L(θ,d(x))对后验分布h(θx)的数,损失函数为L(θ,d(x)),数学期望称为后验风险,记为
R(dx)=E[L(θ,d(x))]
⎧⎪∫ΘL(θ,d(x)h(θx)dθ,当θ为连续型变量,
=⎨
⎪⎩∑iL(θi,d(x))h(θix),当θ为离散型变量。
假如在D中存在这样一个决策函数d*(x),使得
R(d*x)=infR(dx),∀d∈D.
d
则称d*(x)为该统计决策问题在后验风险准则下的最优决策函数,或称为贝叶斯(后验型)决策函数。
在估计问题中,它又称为贝叶斯(后验型)估计。下面定理给出了贝叶斯决策函数d*(x)与贝叶斯后验型决策函数d**(x)的等价性。
定理3.5 对给定的统计决策问题(包括先验分布给定的情形)和决策函数类D,当贝叶斯风险满足如下条件
infR(d)
d
则贝叶斯决策函数d*(x)与贝叶斯后验型决策函数
d**(x)是等价的。
(即使后验风险最小的决策函数d**(x)同时也使贝叶斯风险最小。反之使贝叶斯风险最小的决策函数d*(x)同时也使后验风险最小。)
定理3.6 设θ的先验分布为π(θ),损失函数为绝对值损失 L(θ,d)=d−θ
则θ的贝叶斯估计d*(x)为后验分布h(θx)的中位数。
又设d=d(x)为θ证明* 略 设m为h(θx)的中位数,
的另一估计。为确定起见,先设d>m。由绝对损失函数的定义可得
⎧m−d,θ≤m,⎪
L(θ,m)−L(θ,d)=⎨2θ−(m+d),m
⎪d−m,θ≥d,⎩
当m
2θ−(m+d)≤2d−(m+d)=d−m。所以上式为
⎧m−d,θ≤m,
L(θ,m)−L(θ,d)≤⎨
d−m,>m,θ⎩
由中位数定义知P(θ≤mx)≥而P(θ>mx)≤。由此可知后验风险的差为
R(mx)−R(dx)=E[L(θ,m)−L(θ,d)] ≤(m−d)P(θ≤mx)+(d−m)P(θ>mx)
≤(m−d)/2+(d−m)/2=0.
1
212
于是对d>m有 R(mx)≤R(dx)
类似地,对d
定理3.7 在线形损失函数
⎧k0(θ−d),d≤θ,
L(θ,d)=⎨
⎩k1(d−θ),d>θ.
下,θ的贝叶斯估计d*(x)为后验分布h(θx)的分位数。
1k0+k1
上侧
证明首先计算任一决策函数d=d(x)的后验风险
R(dx)=∫−∞L(θ,d)h(θx)dθ
+∞
=k1∫−∞(d−θ)h(θx)dθ+k0∫d(θ−d)h(θx)dθ
=(k1+k0)∫−∞(d−θ)h(θx)dθ+k0(E(θx)−d).
d
d∞
* 略利用积分号下求微分的法则,可得如下方程:
dR(dx)d(d)
d
=(k1+k0)∫−∞h(θx)dθ−k0=0,
d
∫−∞h(θx)dθ=
∞
0,
k1+k0
即 ∫dh(θx)dθ=1−
0=1, k1+k0k0+k1
这表明d是后验分布h(θx)的
1k0+k1
上侧分位数。
其中参数例3.11 设总体X服从贝努利分布b(1,p),
p未知而p在[0,1]上服从均匀分布,(X1,X2,",Xn)是来
T
自X的样本。假定损失函数是二次损失函数
L(p,d)=(p−d),试求参数p的贝叶斯估计及贝叶斯风
2
险。
解 由定理3.2知,当损失函数为二次损失函数时,欲求p的贝叶斯估计需先求p的后验分布
h(px)=q(xp)π(p)/m(x)。
由于给定p,X的条件概率是f(xp)=px(1−p)以(X1,X2,",Xn)的条件概率是
q(xp)=∏pxi(1−p)
i=1n
1−xi
1−x
所
T
=pi=1
∑xi
n
(1−p)
n−
∑xi
i=1
n
而p的先验概率密度为π(p)=1,p∈[0,1],所以
T
(X1,X2,",Xn)与p的联合密度为
n
f(x,p)=pi=1
n
∑xi
(1−p)(1−p)
n
n−
∑xi, X,X,",XT的边缘分布是 i=1(12n)∑xidp=β(x+1,n+1−i=1∑i∑xi)
i=1
i=1
n
n
m(x)=∫p
1
∑xi
i=1
n−
nn
=(∑xi)!(n−∑xi)!/(n+1)!
i=1
i=1
n
最后两个等号成立是根据
β(p,q)=∫xp−1(1−x)
01
q−1
dx 和
β(p,q)=Γ(p)Γ(q)/Γ(p+q),Γ(n+1)=n! 而得。
所以p的后验分布为
pi=1(1−p)i=1f(x,p)
h(px)==n
m(x)⎡(x)!(n−nx)!⎤/(n+1)!
∑i∑i⎥⎢ii1==1⎣⎦=
(n+1)!(∑xi)!(n−∑xi)!
i=1
i=1
n
n
∑xi
n
n−
∑xi
n
pi=1
∑xi
n
(1−p)
n−
∑xi
i=1
n
因此的贝叶斯估计是
ˆ=∫ph(px)dp p
01
=∫
1
n
(n+1)!
(∑xi)!(n−∑xi)!
i=1
i=1n
p
∑
i=1
n
xi+1
(1−p)
n−
∑xi
i=1
n
dp
=
(n+1)!
n
n
i=1
i=1
⋅
Γ(∑xi+2)Γ(n−∑xi+1)
i=1
n
i=1n
i=1
i=1
nn
(∑xi)!(n−∑xi)!Γ(∑xi+2+n−∑xi+1)
=
n
(n+1)!
(∑xi)!(n−∑xi)!
i=1
i=1
n
n
⋅
[(∑xi+1)!][(n−∑xi)!]
i=1
i=1
nn
(n+2)!
=
i=1
∑xi+1n+2
.
这个估计的贝叶斯风险为
ˆ)=∫E⎡ˆ−p)dp R(p⎣L(p,d)p⎤⎦π(p)dp=∫0E(pΘ
1
2
=∫E[i=1−p]2dp 0n+2
1
∑x
n
i
+1
⎡n⎤ 11
=E+−+1(n2)p∑X∫i⎥dp(n+2)0⎢⎣i=1⎦
2
⎡n⎤而 E⎢∑Xi+1−(n+2)p⎥=E
⎣i=1⎦
ni=1
2
[Y−np+1−2p]
2
其中Y=∑Xi服从二项分布B(n,p),再把上式平方展开并分别求期望得
E(∑xi+1−(n+2)p)2=np(1−p)+(1−2p)2
i=1n
ˆ)=所以 R(p
1
(n+2)
1
np(1−p)+(1−2p)dp ∫0
1
[
2
]
=
(n+2)
1
20
∫[(4−n)p+(n−4)p+1]dp
1
2
=
1⎡4−nn−4⎤
++1=2⎢⎥6(n+2) 32⎦(n+2)⎣
1n
=∑xi=X, ni=1
ˆMLE附带说明一点,对于p的最大似然估计p
可求出其贝叶斯风险为1/6n。
例3.12(略) 假设总体X服从正态分布N(µ,1),其中参数µ是未知的,假定µ服从正态分布N(0,1),并假设X1,X2,",Xn是来自该总体的样本。对于给定的损失函数L(µ,d)=(µ−d),试求µ的贝叶斯估计量。
解 给定µ,(X1,X2,",Xn)的条件分布密度为
q(x1,x2,",xnµ)=
T
2
⎧1n2⎫xµexp−−()⎨⎬ ∑in
2i=1⎩⎭1
T
(X1,X2,",Xn)与µ的联合密度是
f(x,µ)=
1
(2π)
n+12T
⎧1⎡n2⎤⎫exp⎨−⎢∑xi+(n+1)µ2−2µnx⎥⎬
⎦⎭⎩2⎣i=1
(X1,X2,",Xn)的边缘分布密度是
m(x)=∫−∞f(x,µ)dµ
⎧1⎡n22⎤⎫ exp(n1)2µn=∫−∞−++−µ∑⎨⎬dµxi+⎢⎥2=i1⎦⎭(2π2⎩⎣
+∞
+∞
1
=
⎧1⎫⎧1n2⎫∞2
expexp(n1)2µnx−+−−µ∑⎨⎬dµ ⎨⎬x∫n+1i−∞
⎩2⎭(2π2⎩2i=1⎭
1
[]
2
⎧2⎤⎫2⎪⎛1⎞⎪1⎡nexp=−−∑⎟ ⎨xx⎢⎥⎬⎜nin+121=i⎪⎪⎦⎭⎝n+1⎠(2π2⎩⎣
1
)
1
2
于是µ的后验分布密度是
⎛ h(µx)=f(x,µ)=⎜
m(x)
n+1⎞
⎟⎝2π⎠
12
2
⎧⎫
⎛⎞nx⎪ ⎪n+1
exp⎨−µ−⎬⎜⎟2⎪n+1⎠⎪⎝⎩⎭
所以µ
的贝叶斯估计为
ˆ=∫µh(µx)dµ=µ
−∞∞
2
⎧⎫
⎛⎞nx⎪⎪∞
µ−⎬dµ⎟n+1⎠⎪ ⎩⎭
1nnx
==∑n+1n+1i=1xi
若X服从N(µ,1),µ服从N(0,k2),L(µ,d)=(µ−d)则
2
nk2
ˆµ的贝叶斯估计为 µk=∑x
1+nk2i=1i
k2
ˆk)=贝叶斯风险为B(µ,请读者自行计算。
1+nk2
由上所述可知,构造贝叶斯估计量主要取决两点:参数的先验分布和损失函数。在满足一定的条件下,可以证明贝叶斯估计量具有一致性,渐近正态性和渐近有效性。
例3.13 设X=(X1,",Xn)T是来自均匀分布U(0,θ)的一个样本,又设θ的先验分布为pareto分布,其分布函数与密度函数分别为
⎛θ⎞
F(θ)=1−⎜0⎟,θ≥θ0,π(θ)=αθ0α/θα+1,θ≥θ0
⎝θ⎠
α
该分布记为Pa(α,θ0)。θ的数其中00为已知。
学期望E(θ)=αθ0/(α−1)。在上述假设下,样本X与θ的联合分布为
f(x,θ)=αθ0α/θα+n+1,0
设θ1=max(x1,x2,",xn,θ0),则样本X的边缘分布为
g(x)=∫
∞θ1
αθ0ααθ0α
dθ=,0
由此可得的后验密度函数
f(x,θ)(α+n)θ1α+n
h(θx)==,θ>θ1 α+n+1
g(x)θ
这仍是pareto分布Pa(α,θ1)。
ˆ是后验分布的中在绝对值损失下,θ的贝叶斯估计θB
ˆ是下列方程的解。 位数,即θB
F(θ|x)=∫h(θx)dθ=∫
Θ
ˆθ
B
(α+n)θ1
α+n
θ1
θα+n+1
⎛θ1dθ=1−⎜
⎜θ⎝B⎞⎟⎟⎠
α+n
=
1, 2
ˆ解之可得 θB=2θ1
ˆ是后验均若取平方损失函数,则θ的贝叶斯估计θB1
ˆ=值,即 θB1
α+n
max(x1,",xn,θ0).
α+n−1
例3.14 设X=(X1,",Xn)为取自Γ分布Γ(r,θ)的一个样本,其中r已知。其期望EX=与θ−1成正比。通常人们对θ−1有兴趣,现求θ−1的估计。为此取Γ分布Γ(α,β)作为θ的先验分布。容易获得θ的后验分布。
h(θx)∝θ
α+nr−1
r
θ
e
−θ(
∑xi+β)
i=1
n
,θ>0
2
1⎞⎛
若取如下平方损失函数 L(θ,d)=⎜d−⎟
θ⎠⎝
则θ−1的贝叶斯估计为
⎛n⎞
+xβ⎜∑i⎟
⎜⎟⎝i=1⎠Γ(α+nr)
α+rn
ˆ−1=E(θ−1x)= θB
∫
∞
1
θθ
⎛n⎞
xi+β⎟−θ⎜⎜⎟α+nr−1⎝i=1⎠
e
∑
dθ
⎛n⎞
=⎜∑xi+β⎟/α+nr−1 ⎝i=1⎠
1⎞
若取如下损失函数 L(θ,d)=θ2⎛ d−⎜⎟θ⎠⎝
2
这时θ−1的贝叶斯估计为
ˆ−1=E(θ⋅θx)=θ1
E(θ2x)
2
−1
∫∫
∞
θ
α+nr
e
⎛n⎞
xi+β⎟−θ⎜⎜⎟⎝i=1⎠
∑
dθdθ
∞
θ
⎛n⎞
xi+β⎟−θ⎜⎜⎟α+nr+1⎝i=1⎠
e
∑
⎛n⎞
+xβ⎜∑i⎟i=1⎝⎠=α+nr−1θˆ−1 =
α+nr+1α+nr+1B
2.贝叶斯估计的误差
ˆ是θ的一个贝叶斯估计,评定θˆ的误差最好而又设θ
简便的方法是用后验均方误差或其平方根来度量,具体定义如下:
ˆ,贝叶斯估计为θ定义3.8 设参数θ的后验分布为h(θx),
则(θˆ−θ)2的后验期望 MSE(θˆx)=Eθx(θˆ−θ)2
ˆ的后验均方误差. 称为θ
ˆ的后验标准误差,其中而其平方根[MSE(θˆx)]称为θ
1
2
符号Eθx表示对条件分布h(θx)求期望。
ˆ的后验均方误差越小,贝叶斯估计的误差越小。 估计量θ
ˆx)=Eθˆ−θ由于 MSE(θθ|x
()
2
ˆ−θˆ+θˆ−θ]2 =Eθx[θEE
ˆ)(θˆ)2+E[θˆ−θˆ−θ]2+2E(θˆ−θˆ−θ) =Eθ|x(θEθ|xEθ|xEEˆ)2+var(θx) ˆ−θ=Eθ|x(θE
ˆ)2+var(θx) ˆ−θ=Eθ|x(θE
ˆ=E(θx),故ˆ−θ]2,由于θ其中var(θx)=Eθ|x[θEE
ˆ)(θˆ−θˆ−θ)=0 2Eθ|x(θEE
ˆ为θ的后验期望θˆ=E(θx),即θˆ=θˆ时,有 当θEE
ˆx)=Eθˆ−θMSE(θEθ|xE
()
2
=var(θx)
1
2
var(θx)称为后验方差,其平方根[Var(θ|x)]称为后验标
准差。
ˆ为后验均值θˆ=E(θx)时,可使后验均方差这表明,当θE
达到最小,所以在实际中常常取后验均值作为θ的贝叶斯估计值。
贝叶斯估计与经典统计中估计量方差的区别: 贝叶斯估计:后验方差及后验均方差只依赖于样本X,不依赖于θ,故当样本给定后,它们都是确定的实数,立即可以应用。
经典统计:估计量的方差常常还依赖于被估参数θ,估计
量方差的计算有时还要涉及抽样分布(估计量的分布)。
寻求抽样分布在经典统计学中时常是一个困难的数学问题。如用样本方差估计正态总体方差。估计量方差的计算要涉及估计量的分布。
然而,在贝叶斯估计中从不涉及寻求抽样分布问题,这是因为贝叶斯估计只考虑出现的样本X,对未出现的样本不加考虑。
注意:在贝叶斯估计中不用无偏性来评价一个估计量的好坏。这是因为
ˆ(X)=θ,其中1). 在无偏估计的定义中Eθ
X=(X1,",Xn)T为样本。这里,数学期望是对样本空间中
所有可能样本X而求的。
但是在实际中绝大多数样本尚未出现过,甚至重复数百次也不会出现的样本也要在评价估计量中占一席之地,这是不合理的。
2).另一方面,在实际使用中不少估计量只使用一次或数次,所以贝叶斯学派认为,评价一个估计量的好坏只能依据在试验中所收集到的观察值,不应该使用尚未观察到的数据。这一观点被贝叶斯学派称为“条件观点”。
据此,估计的无偏性在贝叶斯估计中不予考虑。 3.区间估计
前面曾经提到,后验分布在贝叶斯统计中占有重要地位,当求得参数θ的后验分布h(θx)以后,我们可以计算θ落在某区间[a,b]内的后验概率P(a≤θ≤bx),当θ为连续型变量,且其后验概率为1−α(0
反之若给定概率1-α,要找一个区间[a,b],使上式成立,又称为贝叶斯这样求得的区间称为θ的贝叶斯区间估计。置信区间。
对给定的概率1-α,满足当θ为离散型随机变量时,
上式的区间不一定存在,这时只要略微放大上式左端概率,才能找到a与b,使得 P(a≤θ≤bx)>1−α. 这样的区间[a,b],也称为θ的贝叶斯区间估计。下面给出参数θ的贝叶斯区间估计的一般定义。
定义3.9 设参数θ的后验分布为h(θx),对给定的样本X=(X1,X2,",Xn)T和概率1−α(0
ˆ=θˆ(X)和θˆ=θˆ(X),使得 统计量,θLLUU
ˆ≤θ≤θˆx)≥1−α, P(θLU
ˆ,θˆ⎤为参数θ的置信度为1-α的贝叶斯置信θ则称区间⎡LU⎦⎣
ˆ称为θ区间,或称为θ的1-α可信区间。而满足下式的θL
的1-α(单侧)置信下限:
ˆx)≥1−α, P(θ≥θL
ˆ称为θ的1-α(单侧)置信上限: 满足下式的θU
ˆx)≥1−α, P(θ≤θU
由以上可看出,求参数θ的贝叶斯置信区间只要利用θ的后验分布,而不需要再去寻求另外的分布。
在经典统计学中寻求参数θ的置信区间有时是困难的,因为首先要设法构造一个函数(含有待估参数的随机变量),且使该函数的概率分布为已知,分布中不含任何未知参数,这是一项技术性很强的工作,不熟悉“抽样分布”的人是很难完成的,二者相比,贝叶斯置信区
间的寻求要简单得多。
例3.15** 设X=(X1,X2,",Xn)T是来自正态总体
N(θ,σ2)的一个样本,其中σ
2
已知。取θ的先验分布为正态
分布N(µ,τ2),则θ
的密度函数为
π(θ)=
2⎫θ−µ)⎬,−∞
其中µ与τ2为已知常数,由此可求得样本X与θ的联合密度函数为
n⎧1⎡1⎛2⎫⎤⎪⎞1⎪
f(x,θ)=k1exp⎨−⎢2⎜nθ−2nθx+∑xi2⎟+2(θ2−2µθ+µ2)⎥⎬,
i=1⎠τ⎪⎦⎪⎩2⎣σ⎝⎭
其中 k1=2π
2
−(n+1)/2
τσ,x=∑
−1
−n
i=1
n
xi
。 n
σ2
若再记σ0=,A=σ0−2+τ−2,
n
B=x⋅σ0+µ⋅τ,C=σ
−2−2−2
∑x
i=1
n
i
+µ2τ−2, 则有
⎧1⎫2
⎤f(x,θ)=k1exp⎨−⎡AθθBC2−+⎬⎣⎦
⎩2⎭
12⎫⎧
θB/A=k2exp⎨−−()⎬,−1
2A⋅⎩⎭
其中k2=k1exp⎧⎨−
1⎫
由此容易算得样本C−B2/A)⎬。(⎩2⎭
∞
X的边
缘分布为 g(x)=∫−∞
⎛2π⎞
f(x,θ)dθ=k2⎜⎟
⎝A⎠
1/2
因而θ的后验分布为
2
⎧⎫/−θBA()f(x,θ)⎛A⎞⎪⎪
=⎜−exph(θx)=⎨⎬, ⎟2/Ag(x)⎝2π⎠⎪⎪⎩⎭
1
2
这正好是正态分布N(µ1,σ12)的密度函数。其中
σ02τ2Bxσ0−2+µτ−22
,σ1=2. µ1==2−2−2
Aσ0+τσ0+τ
据此可知
θ−µ1
服从标准正态分布N(0,1),于是可得 σ1
P{|
θ−µ1
|≤uα/2}=1−α σ1
即 P{µ1−uα/2σ1≤θ≤µ1+uα/2σ1}=1−α
其中uα/2为标准正态分布的上侧α/2分位数。故可得θ的1-α贝叶斯置信区间为 [µ1−uα/2σ1,µ1+uα/2σ1] 例3.16 对某个儿童作智力测验,设测验结果
X~N(θ,100),其中在心理学中定义为儿童的智商,根据
多次测验,可设θ服从正态分布N(100,225),应用例3.15的结论,当n=1时,可得在给定X=x条件下,该儿童智商θ的后验分布服从正态分布N(µ1,σ12),其中
µ1=
100×100+225x400+9x
=,
100+22513
σ12=
100×2259002
==69.23(8.32)
100+22513
若该儿童在一次智商测验中得x=115,则可得其智商θ的后验分布为N(100.38,8.322),于是有
P(−uα/2≤
θ−110.38
≤uα/2)=1−α, 8.32
其中uα/2为标准正态分布的上侧分位数。当给定α=0.05
时,查正态分布数值表求得uα/2=1.96,故有
P(110.38−1.96×8.32≤θ≤110.38+1.96×8.32)
=P(94.07≤θ≤126.69)=1−α=0.95
于是得θ的0.95的贝叶斯置信区间为[94.07,126.69]. 在本例中,若不利用先验信息,仅利用当前抽样信息, 则也可运用经典方法求出θ的置信区间。由于X服从 正态分布N(θ,100)和x=x=115,可求得θ的0.95置信区 间为
⎤ ⎡⎣x−uα/2⋅σ,x+uα/2⋅σ⎦=[115−1.96×10,115+1.96×10]
=[95.4,134.6].
我们发现在上述问题中,置信度相同(均为0.95)但两个区间长度不同,贝叶斯置信区间的长度短一些(区间长度短时,估计的误差小),这是由于使用了先验分布之故。