浅谈几个著名的大数定律及应用
浅谈几个著名的大数定律及应用
李 蕊
(青海大学成教学院,青海 西宁,810001)
摘 要 大数定律以严格的数学形式表达了随机现象最根本的性质——平均结果的稳定性,是随机现象统计规律性的具体表现,本文介绍了几种常用的大数定律,并给出一些简单应用。
关键词 大数定律 随机变量 数学期望 概率
1 引言
“大数定律”本来是一个数学概念,又叫做“平均法则”。在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律,通俗地说,这个定理就是在试验不变的条件下,重复试验多次,随机事件的频率以概率为稳定值。比如,我们向上抛一枚硬币,硬币落下后哪一面朝上本来是偶然的,但当我们向上抛硬币的次数足够多时,达到上万次甚至几十万几百万次之后,我们就会发现,硬币向上的次数约占总次数的二分之一。偶然中包含着必然。
从概率的统计定义中可以看出:一个事件发生的频率具有稳定性,即随着试验次数的增多,事件的频率逐渐稳定在某个常数附近.人们在实践中观察其他一些随机现象时,也常常会发现大量随机个体的平均效果的稳定性。这就是说,无论个别随机个体以及它们在试验进行过程中的个别特征如何,大量随机个体的平均效果与每一个体的特征无关,且不再是随机的深入考虑后,人们会提出这样的问题:稳定性的确切含义是什么?在什么条件下具有稳定性?这就是大数要研究的问题。
2 几个大数定律
在介绍大数定律之前,先介绍几个相关定义。
定义1[1]设ξn (n=1,2,……)为概率空间(Ω,F,P)上定义的随机变量序列(简称随机序列),若存在随机变数ξ,使对任意ε>0,恒有: 则称随机序列 依概率收敛于随机变量ξ(ξ也可以是一个常数),并用下面的符号表示:
定义2[2]设 为一随机序列,数学期望E(ξn )存在,令 ,若 ,则称随机序列 服从大数定律,或者说大数法则成立。
切比雪夫不等式
设随机变量X的数学期望E(X)与方差D(X)存在,则对于任意正数ε,不等式
都成立。不等式(1)和(2)称为切比雪夫不等式。切比雪夫不等式给出了在随机变量X的分布未知的情况下,只利用J的数学期望和方差即可对J的概率分布进行估值的方法,这就是切比雪夫不等式的重要性所在。
大数定律形式很多,我们仅介绍几种最常用的大数定律。定理1[1] (切比雪夫大数定律)
设随机变量ξ1,ξ2,…ξn 相互独立,它们的数学期望依次为a221,a 2,…an 方差依次为σ1,σ2,…σ2n 而且存在正常数k,使得对一切i=1,2,…,有σ2i
切比雪夫大数定律说明:独立随机变量序列ξ1,ξ2,…ξn
的数学期望与方差都存在,且方差一致有上界,则经过算术平2010.No34 4
均后得到的随机变量 ,当n充分大时, 以概率1趋于
。这样,切比雪夫大数定律给出了平均值稳定性科学的描述。
推论1[1]:设随机变量ξ1,ξ2,…ξn 相互独立,它们具有相同的数学期望和方差,Eξi =a,Dξi =σ2(i=1,2,…)则对于任意给定的正数ε,有
此推论表明:n个相互独立的具有相同数学期望和方差的随机变量,当n很大时,它们的算术平均值几乎是一个常数,这个常数就是它们的数学期望。
定理2[2](贝努力大数定律)
设是un 次独立试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对任意给定的正数ε,有
此定理表明:当n很大时,n重贝努力试验中事件A发生的频率几乎等于事件A在每次试验中发生的概率,这个定理以严格的数学形式刻画了频率的稳定性,因此,在实际应用中,当试验次数很大时,便可以用事件发生的频率来代替事件的概率。贝努力大数定律是切贝晓夫大数定律的特例,在它们的证明中:都是以切贝晓夫不等式为基础的,所以要求随机变量具有方差,但是进一步的研究表明,方差这个条件并不是必要的。
定理3[2](辛钦大数定律)
设ξ1,ξ2,…ξn 是相互独立的随机变量,而且有相同的分布,具有有限的数学期望Eξi (i=1,2,…),则对任意给定的正数ε,有 ,其中 a=Eξi
前面说过贝努力大数定律表明了当n很大时,事件发生的频率会“靠近”概率,而这里的辛钦大数定律表明,当n很大时,随机变量在n次观察中的算术平均值会靠近它的期望。
定理4[1] (泊松大数定律)
设ξ1,ξ2,…ξn 是相互独立的随机变量,
(其中pn =1-qn ),则 服从大数定律。
泊松大数定律是贝努力大数定律的推广,贝努利大数定律证明了事件在完全相同条件下重复进行的随机试验中频率的稳定性,而泊松定理表明,当独立进行的随机试验的条件变化时,频率仍然具有稳定性.随着n的无限增大,在n次独立试验中,事件A的频率在各次试验中事件A出现概率的算术平均值处取得稳定值。
定理5[1](马尔可夫大数定律)
设{ξi }是随机变量序列,若 ,则{ξi }服从大数定律。
3 应用
3.1 误差领域的应用
例1 仪器测量已知量A时,设n次独立得到的测量数据为 x 1,x 2…xn 如果仪器无系统误差,问:当n充分大时,是否可取
作为仪器测量误差的方差的值?
解:把xi 视作n个独立同分布的随机变量(i=1,2…n)的观察值,则E(X2
i )=u,D(Xi )=σ(i=1,2,…,n),仪器第i次测量的
误差Xi -A的数学期望E(Xi -A)=u-A,方差D(Xi -A)=σ2,设yi =(Xi -A) 2,i=1,2…n,则yi ,也相互独立服从于统一分布。在仪器无系统误差时E(Xi -A)=0,既有u=A
E(yi )=E[(Xi -A) 2]=E[(Xi -E Xi ) 2],D(Xi )=σ2,i=1,2,…n由切比雪夫定律,可得:
即 。从而,当n→∞时,随机变量 依概率收敛于σ2,即当n充分大时,可以取 作为仪器测量误差的方差。
根据大数定律,对于随机误差ξ1,ξ2,…ξn ,应有 这说明当测量次数较多时,实测数据的平均值 和预测真值的差以很大概率趋于0,因此,用求样本数据平均值的方法来进行测量是可行的。
3.2 在分布型未知的情况下估计数学期望E(ξ)及方差D(ξ)
若ξ及{ξk }都是随机变量,则有:
似值。
例3[3].假设 求其极限。解:假设随机变量ξn (n=1,2,…n),在[0,1]上均匀分布,而且相互独立,有
由ξ1,ξ2,…ξn 独立同分布,可见ξ12…ξ22…独立同分布,根据辛钦大数定律知:
例4[3].在贝努力试验中,事件A出现的概率率为p,令x n =1,若在第n次及第n+1次试验中A都出现;xn =0其他证明{xn }服从大数定律。
证:{xn }为同分布随机变量序列,其共同分布为p(xn =0)=1-p2,p(xn =1)=p2
且E(xn )=E(xn 2)=p2,从而Var(xn )=p2(1-p2
i 与xj 独立所以
3.3 在数学分析中的应用
例2.计算定积分 的近似值。
为了解这种近似计算的依据,先进行如下分析:
若令 为均匀分布的概率密度函数,即若令 为均匀分布的概率密度函数,即 ,则 而函数g(x)的数学期望 根据大数定律应用可对该数学期望值进行估计,即
故可用
这种近似计算的具体过程如下:
欲计算定积分 的近似值,则应先取样本数列{Xi }→求函数序列(xi )→求出 ,即作为J的近
即马尔可夫条件成立,故服从大数定律。
参考文献
[1]黄清龙,阮宏顺.概率论与数理统计[M].北京:北京大学出版社,2005.
[2]杨亚非.概率与数理统计基础[M].北京:北京工业出版社,2003.
[3]峁诗松,程依明,濮晓龙.概率论与数理统计教程习题与解答[M].北京:高等教育出版社,2005-7.
(上接第63页)
低的条件,在这三个限制条件下选择最佳的承台安全经济高度。
从以上的承台材料费用计算表中的计算结果可知,该桩基实例承台的安全经济高度在1.0 ~1.05 左右。大于此高度时,虽然降低了承台配筋数量,但承台抗冲切满足系数超过3.3,抗剪切满足系数kB1>3.8,kB2>3.1,这说明承台高度设计,十分保守,增大了混凝土材料用量,致使材料总费用偏高;当设计的承台高度小于此高度时,虽然抗冲切系数及抗剪切系数都大于1,满足规范要求,但没有合理地利用承台高度的抗弯能力,使得承台配筋量大为增加,也导致承台材料费用偏高。
根据笔者研究,当采用C15、C20、C25、C30、C35强度等级的混凝土,承台的抗冲切满足系数在分别为(3.05~3.3)、
2010.No34
可由公式
(3.68~4.0)、(4.25~4.64)、(4.79~5.23) 、(5.26~5.74)时的每立方米混凝土含筋率为0.2664~0.2736%(采用HRB335热轧钢筋),(当采用HPB235热轧钢筋时每立方米混凝土含筋率为0.360~0.371%),桩基承台材料费用最低,此时相应的承台高度为安全经济高度。
笔者认为,轴心受压矩形承台的安全经济高度可由公式 初步计算确定(F为竖向力设计值,bc 、hc 为柱截面尺寸);偏心受压矩形承台的安全经济高度一般可用公式
初步计算确定;三角形三桩承台的安全经济高度
初步计算确定。