谈概率论中二项分布的泊松近似与正态近似
谈概率论中二项分布的泊松近似与正态近似
摘要:二项分布是概率论中一个非常重要的分布,它具有广泛的实际应用性。然而,当试验次数很大时用二项概率公式来计算事件发生的概率很麻烦,这样就有必要研究近似计算的方法。本文给出泊松近似和正态近似,并给出二者的对比分析,完整地阐述了二项分布的两种近似情况,它将是众多概率论与数理统计教材的补充,是可靠的理论依据。
关键词:二项分布;泊松近似 ;正态近似;实验数据对比分析
Abstract: the two distribution is the probability distribution of a very important, it has a wide practical application. However, when the test frequency is large with two probability formula to calculate the probability of event occurrence is very troublesome, so it is necessary to study the method of approximate calculation. This paper presents Poisson approximation and the normal approximation, and gives the comparison of the two analysis, a complete exposition of two binomial distribution of two approximate condition, it will be a large number of probability theory and mathematical statistics teaching supplement, is a reliable theoretical basis.
Key words: two distribution; Poisson approximation; normal approximation; comparative analysis of experimental data
概率论是研究随机现象规律性的数学学科,概率论的理论和方法在金融、保险、经济管理、工农业、医学、地质学、空间技术、灾害预报甚至社会学领域中都有着广泛的应用。二项分布是概率论中一个非常重要的分布,它具有广泛的实际应用性,客观世界中描述许多随机现象的随机变量都服从二项分布,生活中常用它来推断稀有事件发生的概率,如推断某一路段汽车出现事故的概率、抽检一大批产品时出现次品的概率等等。
二项分布的概率计算
用此公式计算概率当很小时比较容易,当很大时,比如一天中在某主要路段汽车出现次事故的概率计算,由于一天中经过此路段的车辆数相当大,所以计算起来就很麻烦,这样就有必要研究近似计算的方法——泊松近似和正态近似。经过多年的教学和多部教材的使用发现,对什么时候用泊松近似什么情况下用正态近似众说纷纭,没有一个完整的体系来阐述,更没有两种近似程度优良的比较。
本文在不同情况下经过大量的数据处理给出对比分析,完整地阐述二项分布
的两种近似情况,它将是众多概率论与数理统计教材的补充,是可靠的理论依据。
二项分布的泊松近似
这说明,当很大很小时二项概率的近似计算为
, 其中的值有表可查。 那么当大到什么程度小到什么程度才能有理想的近似效果?表一给出了实验数据:
表一
由表中数据分析可见,当时近似效果一般,当时近似效果较好,时近似效果很好,当时近似效果更好。
二项分布的正态近似
设随机变量服从参数为,的二项分布(),则对于任意实数,有
这说明,当充分大时,不管取0与1之间的什么值都有 ,从而
其中的值有表可查。
那么当多大才能有理想的近似效果? 表二给出了实验数据:
表二
这一概率值的三种分布对照表
由表中数据分析说明,二项分布的正态近似只有使得的才有更好的精确度。对于的值若远离,由便知有更大的。事实上,在时取到最大值,故有,因此在时上述不等式导致,而在远离时,就需更大。
此表数据又说明,很大很小且时,用泊松近似比用正态近似效果好,表中数据更进一步说明时二项分布的泊松近似精度之高。
实际案例及意义
例:经调查,某地区有1800户居民购买某种电器,此种电器的次品率为0.01,求一段时间内发生故障的最可能的台数及其概率.
解:设发生故障的台数为随机变量,则。由表三可以推断发生故障的最可能的台数为=(台),其概率为
由于,所以用泊松近似或用正态近似皆可.
用泊松近似:,
用正态近似:,
可见,两种近似效果都很好,发生故障最可能台数的概率不超过10%,这样厂家可以根据这一数据配备合理的售后服务人员.
综上所述,对于随机变量的概率计算,当很小时用二项概率公式直接计算,当很大时,结合的值,根据实际应用精度的要求,可以选择适当的近似计算。