统计与决策基于帕累托分布的洪水贝叶斯分析
基于帕累托分布的洪水贝叶斯分析
黎协锐
(梧州学院数理系,广西梧州543002)
摘要:文章基于帕累托分布,运用贝叶斯估计理论研究了汛期洪水水位的分布规律,给出了相关参数的计算
公式,并通过具体例子进行了讨论。
关键词:帕累托分布;洪水水位;贝叶斯分析中图分类号:O212.8文献标识码:A文章编号:1002-6487(2012)02-0024-03
结论,对洪水的变化规律作出更实时有效的预测预报。
0引言
1
研究汛期洪水水位的变化规律是应用水文学的一个重要内容,对洪水作出及时准确的预报预警是防洪减灾工作的关键,作为防汛斗争的“耳目”和“参谋”,为各级防汛抗旱部门正确作出防汛决策提供科学依据。洪水预报预警是预测江河未来洪水要素及其特征值的一门应用技术科学,是根据洪水形成和运动的规律,利用水文气象数据资料,对未来一定时段内的洪水发展情况进行预测预报分析,是防洪抗灾决策的重要依据,是一项重要的防洪非工程措施。根据洪水预报,可以事先对防洪工程(水库、闸坝)进行合理调度,及时拦洪、泄洪、削减洪峰,与下游区间洪水错峰,有效控制洪水。根据洪水预报,可以有计划地运用分蓄洪区拦蓄超额洪水,牺牲局部,保护全局,减少洪灾损失。根据洪水预报,可以事先组织群众进行防洪抢险,加高加固堤防,组织分洪区群众转移,保障人民生命财产的安全。一般的洪水分析模型往往注重现有的水文数据,对以往的水文统计资料利用得不够充分。运用贝叶斯分析方法不但可以充分利用现有数据信息,同时能有效应用以往的水文数据和
构建预报模型是洪水预报系统的核心,预报系统各模块均是围绕预报模型而开发的。因此根据不同情况研究各种洪水的预报模型,建立预报模型库,是进行洪水预报的最关键部分。目前在实时洪水预报方面,比较实用的是确定性概念模型。按照模拟的对象不同可分为河道汇流模型、流域产流模型、流域汇流模型、经验模型等。构建洪水预报模型的基本出发点是致力于提高洪水预报的精度,增长洪水预报的有效预见期,扩大预报范围,提高预报作业速度,为各级防汛抗旱部门提供预报精度和预见期均满足防洪调度决策要求的洪水预报成果。根据对我国重点防洪流域——珠江流域西江干流梧州水文站1949~2010年历次洪水洪峰水位数据的分析表明(如图1,其中18米为梧州水文站的洪水警戒水位,超过这个水位就会就成洪灾),洪水洪峰水位的分布可以看作是近似于右倾斜的分布,适合于用帕累托(Pareto)分布进行描述。帕累托分布最早是作为研究超过某一已知值λ的收入分布问题引进的,后来在研究
基于帕累托分布的洪水贝叶斯分析
基金项目:广西自然科学基金资助项目(2010GXNSFA013124);广西教育厅科研资助项目(2008071LX388);梧州学院科研资助项目(2008C024)
作者简介:黎协锐(1964-),男,广西梧州人,硕士,副教授,研究方向:贝叶斯估计理论及应用、数学建模。
扰动因素β修正初值法来提高模型的精度,大大弱化了干扰因素,揭示了系统的运行规律,使得模型更为稳定。该方法保留了GM(1,1)模型建模计算简便和易于应用的优点,不存在复杂的计算。从实例分析上看,该方法能得到比原GM(1,1)模型更高的精度和适应性,无论在微观经济还是宏观经济上,都具有重要的理论价值和实践意义。
参考文献:
[1]刘思峰,党耀国,方志耕.灰色系统理论及其应用[M].北京:科学出版社,2004.
[2]张圆刚,王心源.基于灰色系统理论经济视域下的农村居民出游可行性分析[J].经济问题探索,2008,(11).
[3]DengJuLong.SolutionofGreyDifferentialEquationforGM(1,1|τ,r)[4]王义闹,刘光珍,刘开第.GM(1,1)模型的一种逐步优化直接建模法
(1)
[5]党耀国,刘思峰,刘斌.以x(n)为初始条件的GM模型[J].中国管理科
inMatrixTrain[J].TheJournalofGreySystem,2002,14(1).[J].系统工程理论与实践,2000,20(9).
学,2005,13(1).
[6]李俊峰,戴文战.GM(1,1)改进模型的研究及在上海市发电量建模中的应用[J].系统工程理论与实践,2005,3(3).
[7]中华人民共和国国家统计局.中国统计年鉴2010[M].北京:中国统计出版社,2010.
(责任编辑/亦民)
24
统计与决策2012年第2期·总第350
期
城市人口分布,股票价格的起伏等问题中得到广泛应用。
在防洪研究中,假设有n个独立的洪水洪峰
图11949~2010年西江干流梧州文化站历次洪水
水位排列
E(θr)=∫0
+∞
(na)θn-1-naθθ
θred
n
E(θr)=∫ -∞θrf(θ|x,λ)dθ
∞(na)n11θ)n+r-1e-naθd(naθ)=(na∫ 0
+∞
(na)n(na)-r=Γ(n+r)=Γ(n+r)
水位观测值
x=(x1,x2,⋯,xn)
特别地
(na)-11θE()=Γ(n+1)=可以用这个作为参数θ的最优估计点。而洪水水位x落入某区间λ
bθθθθθ
xP(a
θ θ
θf(x|λ,)= (0
(na)nθn-1-naθ
θ用f(|x,λ)=e, 0
θnmθ**θxx本中的先验密度,的似然函数为L(|,λ)∝。A*
其中A*为m个新观测值的几何平均。利用贝叶斯定
,他们来自帕累托分布
θθìï 0
f(x|λ,θ)=íï
î0 x
θ为形状参数。在这里λ为成灾其中λ为尺度参数,
θ洪水水位值(超过这个值才会造成灾害,称为灾害洪水),为未知参数,研究洪水水位大于λ的问题。假定我们开始
时对参数θ的信息是分散的或不明确的,采用Jeffrey先验分布来表示这种状况的先验信息,即
f(θ)∝(0
似然函数为:
L(θ|x,λ)=∏f(xi|λ, θ)=
i=1n
θnnθθnnθ
=12nA其中,A=nx1x2⋯xn为观测值的几何平均。将先验信息和似然函数利用贝叶斯定理合并,即得θ的后验分布
f(θx,λ)∝L(θ|x,λ)f(θ)∝e
-nθLn(A)
理将上面的先验分布和似然函数合并,基于两组数据的后验分布为
f(θ|x,x,λ)∝
*
|
θn-1nθA
∝θn-1(n=θn-1
θ
θn+m-1(n+m)θA*∝
θn+m-1(n+m)θ
A
1
2
∝θn+m-1
记a=Ln(),则有
θ
f(θ|x,λ)=kθn-1e-na对后验分布密度正则化
e
-a2(n+m)θ
A*
其中,A2=(x1,⋯,xn,x1,⋯,x*;a=Ln(2)。m)这同样是Γ分布的形式。依次类推,这样不断地根据
e
dθ=1
∫0
∞
f(θ|x,λ)dθ=1k∫0θ
1
θ
n-1-naθ
最新的观测数据利用贝叶斯定理对历史数据进行修正,从而得到实时的预测结果。2实际问题中的处理
在实际研究中,利用帕累托分布进行分析时,一般不是直接利用个别的观测值x1,x2,⋯,xn,更多的是利用频率如历年洪水水位落入特定区间xtn0,n1,⋯nt,nt+1,⋯,nT,
到xt+1的频数nt,这里x0=λ; t=0, 1, ⋯,T。洪水水位x落入某区间xt
xt+1
t
从而得到参数θ的后验密度为
n|(na)|θn-1e-naθ;(0
|
这是Γ分布的形式,即θ~Γ(n1)。
这个基于样本观测值x1,x2,⋯,xn和Jeffrey先验分布的θ的后验分布Γ(n, )代表了对有关θ的认识,我们可
以计算c1
P(c1
C2
1
(na)n
k===
n-1-nθaθn-1-naθθθθ0ed0(na)ed(na)(na)n
θθxθd=λ(-(t=0,1,⋯,T)tt+1(na)nC2θn-1-naθθθθxf(|,λ)d=ed
∫C1
在这里可以用数值积分技术来分析。例如给定了损失
̂),̂值能由数值计函数L(θ,θ使后验期望损失达到极小的θ̂相应的E[L(θ,θ̂)]得到。后验区间也能由数值积算不同θ
θθ
对于xT
次数为nT的概率为
分技术得到。后验矩为
统计与决策2012年第2期·总第350
期
25
T
t=0
θnt
tntnT∏λ(-tt+ntxTt=01
T
θnT-1
的预报模型距离防洪减灾的高要求仍有差距,主要表现在预见期较短、部分项目精度不高、预报范围较少等方面。
一是洪水预报预见期较短。较长的洪水预见期是做好防洪调度决策、生命财产安全转移的前提。目前,我国大部分洪水预报预见期小于2天,有的甚至只有几个小时,致使防洪调度决策仓促,生命财产转移不及时。如长江荆江分洪区的运用需要24小时的决策、转移时间,而目前做出其调度依据沙市站的洪水预报预见期只有9个小时左右,远远满足不了分洪调度要求。
其中,N=∑nt,将其看作是θ的函数就是似然函数,
t=0
可简洁表示为
L(θ|λ,n,N)∝∝e
-anθ
T-1
(T
N
θ
t=0
xtθnt
[1-(∏t+1)]
xtnt)t=0
T-1
xθn
∏[1-(t+t1)]tt=0
1
n
其中,A=(∏Txtt);n=(n0,n1,⋯,nT)。a=Ln(;
t=0给定θ的先验分布f(θ),利用贝叶斯定理与似然函数
二是有些预报项目精度有待提高。预报精度是做好防洪调度决策的另一重要因素,而尤以水位预报精度最为重要。特别是防洪重点地区的大江大河中下游水位预报精度,表现在流量精度较高,而通过水位流量转换后的水位预报却满足不了要求。如2003年淮河洪水期间,王家坝闸是否分洪需要高精度的洪水预报,为使蓄滞洪区人员和财产安全转移需要更长时间的预见期;在1998年长江、松花江、嫩江大洪水期间,各级领导和防汛部门需要高精度的干流水位预报来组织抗洪抢险,甚至要求误差在0.05m范围内,大大高于水文情报预报规范的要求。
三是预报范围满足不了防汛抗旱的要求。目前,开展的预报范围较少,一般只注重大江大河、重要防洪地区的洪水预报,而随着国民经济的发展,防汛抗旱工作的拓展,大江大河的支流、非重点防洪地区的防洪任务日益繁重,迫切需要开展洪水预报工作;同时开展的预报项目较少,注重洪水预报,而对径流、旱情、山洪、水环境预报关注不够。
在洪水预报的实践中,由于预报对象所处的河段、流域和洪水千差万别,根据站点类别、信息种类不同,造成预报模型因预报对象不同而不同,因此根据具体情况构建不同的预报模型并建立足够的模型库是解决问题的关键。如美国天气局河流预报系统(NWSRFS)具有包含28个常用的预报模型的预报模型库,用户可任意选择所需模型用于构建预报方案。
参考文献:
[1]朱慧明,韩玉启.贝叶斯多元统计推断理论[M].北京:科学出版社,[2]茆诗松.贝叶斯统计学[M].北京:科学出版社,1999.2006.
合并得后验密度
f(θ|λ,n,N)∝f(θ)e-aN
θT-1t=0
xθn
∏[1-(t)]t
t+1
如果没有太多的信息可用,先验分布f(θ)同样可采用Jeffrey先验分布的形式,即
1(0
ef(θ|λ,n,N)=k-aNθ
T-1
xθn
∏[1-(t+t1]tt=0
T
n1N
其中,A=(∏xtt)。a=Ln();k为正则化常数;
t=0
如果有足够多的先验信息可用,f(θ)就采用可代表它
的形式,同样对后验密度正则化即可计算出有关参数和进行需要的计算。
表1、表2给出了我国主要的防洪区域之一西江流域梧州水文站1949~2010年的汛期(6~8月)水文数据进行分析,这里共收集了122次洪水的数据,即有122次洪水的水位大于成灾水位λ=18米。
表1
1949~2010年西江干流梧州水文站历次洪水水位频率分布
频
数64
2719102N=122
频率0.530.220.160.080.011.00
t01234
xt(米)
1820222426
洪水水位区间(米)
18~2020~2222~2424~2626~28∑表2项目水位/m流量/m3.s-1
时间(年.月.日)
第一位27.[1**********].7.10
洪水排序表第二位27.[1**********].6.23
第三位27.[1**********].6.28.
第四位26.[1**********].6.19
第五位26.[1**********].7.5
[3]马超群,罗劲虎,杨艳.Gamma分布参数多个转变点的Bayes推断[J].湖南大学学报(自然科学版),1999,(3).
[4]黎协锐.一个概率变点问题的Bayes估计[J].梧州学院学报,2007,(6).[J].中国农村水利水电,2006,(9).策,2009,(21).
[5]高延红.基于实测年最高洪水位的现有堤防加高设计的洪水位分析[6]黎协锐.基于Bayes估计理论的洪水水位概率变点研究[J].统计与决
3结论与对策
虽然洪水预报在防洪减灾中发挥着重要作用,但现有
(责任编辑/亦民)
26
统计与决策2012年第2期·总第350
期