标准正态分布的简洁闭式
2003年6月第30卷 第3期
西安电子科技大学学报(自然科学版)
JOURNAL OF XIDIAN UNIVERSITY
Jun.2003
Vol.30 No.3
标准正态分布的简洁闭式
梁昌洪,李 龙,史小卫
(西安电子科技大学电子工程学院,陕西西安 710071)
摘要:由于不少文献给出的数值闭式相当复杂而不易推广,布的简洁闭式,从其逆函数角度得到分位点的相应闭式,.补偿思想,可获得更为精确的简洁闭式,.
关键词:标准正态分布;分位点;二维圆近似;;中图分类号:O21113 (2003)0320289204
formofstandardnormaldistribution
LIANGChang2hong,LILong,SHIXiao2wei
(SchoolofElectronicEngineering,XidianUniv.,Xi′an 710071,China)
Abstract: Itiswellknownthattheprobabilityintegralandquantileofastandardnormaldistributionareusuallycalculatedbytablelook2up.Alotofliteraturegavealsosomeapproximateformulas,whichareverycomplexandinconvenienttouse.Inthispaper,thecompactclosedformsofthestandardnormaldistributionandquantilearepresentedbyusingthetwo2dimensionalcircularapproximationandinversefunction,whichmakecalculationoftheprobabilitymucheasier.Furthermore,wemakeuseofthecompensationofprimaryandremainderintegralstoderivemoreaccuratelycompactclosedforms,withtheerrordistributionsofthecompactclosedformsgiven.
KeyWords: standardnormaldistribution;quantile;two2dimensionalapproximation;compactclosedform;primary
andremainderintegralscompensation
正态分布是概率论和统计数学中最重要的分布,因此它的计算和应用非常广泛.通常引入标准正态分
布,对应的概率密度表达式为
φ(x)=(2π)-1/2exp(-x2/2) .(1)
π)定义标准正态分布 F(x)=(2和分位点a[1],即
[1]
-1/2
∫
π
-∞
exp(-t2/2)dt
(2)(3)
P{x>a}=Pa ,
式中P和Pa均表示概率,如图1所示.
由于式(2)和(3)并不能简洁表示,因此大多概率论教程都给出相应表格,用于查对[1~
3].但事实上,很多学者均研究过标准正态分布的各种闭式[4~6],也获得较高的精度.只是形式过于复杂,只适合计算机程序使用.笔者从二维圆近似思想出发给出了简洁闭式,便于在一般精度条件下推广使用.
图1 标准正态分布和分位点
1 二维圆近似
设函数f(a)为
π)f(a)=(2
-1/2
∫
-a
a
exp(-t2/2)dt ,
(4)
并将其扩展到二维方形区域,见图2所示,有
收稿日期:2002206220
基金项目:国家自然科学基金资助项目(69931030)作者简介:梁昌洪(19432),男,教授.
290 西安电子科技大学学报(自然科学版) 第30卷
[f(a)]=
π2
2
∫∫exp
-a
-a
aa
-
22
2
dxdy .(5)
这里提出二维圆近似的思想,即以图2中半径为R的圆形区域逼近方形区
域,其概念在于高斯被积函数exp(-t2/2)衰减很快,对积分的主要贡献在坐标原点附近的区域.若再将积分转换成极坐标形式,此时积分可以解析,即
22πR
22
ρdρdφ=1-exp- (6)[f(a)]≈exp-.
π00222
1/2
)a,可得以等面积逼近作为近似的起始点,即πR2=4a2,从而R=(2/π
)a2)]1/2 .(f(a)=[1-exp(-(2/π
如果a>0,即a是上分位点,此时的标准正态分布可表示为
20a
图2 二维方形区域及圆形近似()exp-t+-dtFa=-∞(2π)1/2
(8)
/-
- ;
2
如果a
πa222-∞-a(2π)1/2
最后得到标准正态分布的等面积近似解析式
21/(10)F(a)=11-exp- ,
πa2
式中当a>0时,取正号;当a
从等面积圆逼近的误差分布来看,它并不是最佳的二维圆近似.根据柯林原则[7],等效圆近似的半径R应该在a
1/2
1/2
半径之间.根据这一约束,以等面积圆R0=2a/π为起始点,进行一维优化搜索.最终获得最佳的近似圆半径
(11)Ropt=1.1160a .
∫∫
∫∫∫
最佳的标准正态分布二维圆近似解析式为
21/2
F(a)=[1±(1-exp(-a/1.6058))]/2 ,(12)此时的误差分布如图3所示.可见,最大绝对误差优于01165%.
在概率论和数理统计中,还存在这样一类逆问题,即已知其正态概率分布Pa=1-y=1-F(a),求其上分位点或下分位点.如果利用式(12)的近似公式,可以得到其逆函数关系a=F-1(y),即
-1
a=F(y)=±[-1.6058・ln(4y(1-y))]1/2 .
(13)
如果直接从式(13)来近似计算分位点的值
,发现误差还是比较大的,为此,定义参数函数z,
(14)z=-ln[4y(1-y)] ,
根据式(13),采用两项修正公式近似,即
21/2
(15)a=±(Az+Bz) ,
以误差函数最小min{E=a-a0}作为优化目标函数,其中a0来自于文献[3]的标准正态分布表值.通过二维参数优化,当A=1.5851,B=0.0238时,在概率y≤0.9999,即Pa>0.0001时,可得分位点近似计算值与查表值的相对误
图3 标准正态分布近似计算误差分布
图4 分位点近似计算相对误差分布图
第3期 梁昌洪等:标准正态分布的简洁闭式291
差优于01461%,如图4所示.
从上述分析可见,在误差要求不是特别严格的情况下,可以分别采用式(12)和式(15)近似计算标准正态分布和分位点,其公式简洁适用,精度高,这对概率论和数理统计的理论研究和实际应用都有重要意义.
2 进一步工作
如果在式(12)基础上再略作改进,则下面的正弦修正工作值得推荐,即
21/2
F(a)=[1±(1-exp(-a/1.6058))]+0.3 ,
2
其绝对误差可降至010716%.
为了进一步减小误差,近积分作为主项积分,,如
22222
图5所示.I220I12I0,I1,I2表示余项积分,21/2
(17)(a)=(1+(I))/2 .
设最佳圆的逼近半径R=Aa,根据前面分析,主项积分能解析为22I0=[1-exp(-A2a2/2)].I21和I2可采用积分中值定理进行计算,其中
2
I1
(16)
=π2
∫dθ∫
-α
α
Aa
a/cosθ
exp-
2
2
rdr ,(18)
α=arccos(1/A),于是在取中值点θ=0°处,有
图5 主余项积分补偿22
2221/22
()I1=aexp- ,(19)
πAarccosA-A-122
2a/cosθ
π/2-α2
(20)完全类似I2=dθexp-rdr .
πα22Aa
取中值点θ=45°时,可以得到
22
221/22π2
(())-A(21)I2=-arccosaexp- ,π1-A-124A2
所以,
标准正态分布的解析计算可更精确地近似为
2222221/2
22
(22)F(a)=1+1-exp--d1aexp-+d2aexp- ,
2222
同样以误差函数最小作为优化目标,采用单纯形法对参数A,B和C进行优化,得到
A=1.13760 ,
d1=0.0641527 ,
(23)B=1.08351 ,d2=0.0537057 ,
C=1.22505 ,
其中d1,d2是用A表达的系数,因为比较复杂,所以在式(23)中直接给出具体数值.这里所推荐的式(22)分
∫∫
布,其最大绝对误差优于1170×10-5,见图6所示.
(24)对于分位点,只需多取一项,即a=±(Az+Bz2+Cz3)1/2 ,
A=1.5717125100 ,
(25)其中z=-ln[4y(1-y)],取B=0.0368482455 ,
C=-0.0014958561 ,
即可在概率y≤0.9999时(Pa>0.0001时),计算相对误差优于2191×10-4,
具体见图7.这里分别给出由简洁闭式(12)计算的标准正态分布概率和由式(15)计算的分位点值列表,如表1,2所示.
3 结 论
笔者根据二维圆近似思想,给出了标准正态分布的简洁闭式
21/2
F(a)=[1±(1-exp(-a/1.6058))]/2 ,
292 西安电子科技大学学报(自然科学版) 第30卷
图6 图7 方位点a进一步闭式误差分布
标准正态分布概率表
aPaPaPaPaP
[***********][***********]199992
[***********][***********]199995
[***********][***********]199997
[***********][***********]199998
[***********][***********]1999988
[***********][**************]
[***********][**************]
[***********][**************]
[***********][**************]8
表2 标准正态分布分位点值
PaaPaaPaaPaaPaa
0.50000.00000.18410.90220.03591.79610.00352.68760.000163.5993
0.46020.10040.15861.00200.02871.89500.00252.78740.000113.7029
0.42070.20080.13561.10160.02271.99380.00192.88750.000073.8072
0.38210.30130.11511.10120.01782.09260.00132.98790.000053.9121
0.34460.40160.09681.30060.01392.19150.00103.08870.000034.0176
0.30850.50190.08071.39990.01072.29040.00073.1899
0.27420.60210.06681.49910.00822.38950.00053.2915
0.24200.70230.05481.59810.00622.48870.00033.3936
0.21180.80230.04451.69710.00472.58800.000233.4962
其最大绝对误差优于01165%;分位点闭式a=±(Az+Bz2)1/2,其中z=-ln[4y-(1-y)]且A=115851,
B=010238,在概率y≤0.9999时,即Pa>0.0001时,分位点近似计算的相对误差优于01461%.这两个简洁闭式很适合在一般精度要求下推广应用.参考文献:
[1]王梓坤1概率论基础及其应用[M]1北京:科学出版社,1976.[2]复旦大学1概率论基础[M]1北京:人民教育出版社,1979.
[3]盛 骤,谢式千,潘承毅1概率论与数理统计[M]1北京:高等教育出版社,1995.[4]中国科学计算中心概率统计组1概率统计计算[M]1北京:科学出版社,1979.
[5]HastingsC
Jr,HaywardJT,WongJPJr.ApproximationsforDigitalComputers[M].Princeton:PrincetonUniversityPress,1955.[6]TodaH.AnOptimalRatinalApproximationforNormalDeviatesforDigitalComputers[J].BullElectrotechLab,1967,31(12):12592
1270.
[7]CollinRE.FieldTheoryofGuideWaves[M].NewYork:McGraw2HillBookCompany,1960.
(编辑:郭 华)